windows智能化:Microsoft Graph与GraphRAG
Author:zhoulujun Date:
Microsoft Graph
个人理解就是:Microsoft Graph就是Microsoft 365的对外接口
Microsoft Graph 公开了 REST API 和客户端库,它们可访问以下 Microsoft 云服务上的数据:
Microsoft 365 核心服务:Bookings、日历、Delve、Excel、Microsoft 365 合规电子数据展示、Microsoft 搜索、OneDrive、OneNote、Outlook/Exchange、人员 (Outlook 联系人) 、Planner、SharePoint、Teams、To Do Viva Insights
企业移动性 + 安全性服务:高级威胁分析、高级威胁防护、Microsoft Entra ID、Identity Manager和Intune
Windows 服务:活动、设备、通知、通用打印
Dynamics 365 Business Central 服务
具体参看https://learn.microsoft.com/zh-cn/graph/overview
这个东西打通了微软生态下所有应用的数据,并成为了实现 Microsoft 365 Copilot 的重要基础设施之一。
而GraphRAG,则让微软助手处理本地文件、系统集成等等,真的让windows变成 智能系统
GraphRAG
GraphRAG项目是微软团队的一项创新研究,旨在优化基于检索增强生成(RAG)的问答系统,尤其是针对整个文本语料库的全局性问题,如“数据集的主要主题是什么?”这种查询聚焦的总结任务。这种方法不仅适用于直接检索,还能应对大规模文本索引带来的挑战。
关键论文理论依据:《从局部到全局:一个基于图形的RAG方法用于查询聚焦的总结》,即《From Local to Global: A Graph RAG Approach to Query-Focused Summarization》
作者:Darren Edge, Ha Trinh, Newman Cheng, Joshua Bradley, Alex Chao, Apurva Mody, Steven Truitt, Jonathan Larson
2024年7月微软发布了最新的GraphRAG架构。
检索增强生成 (RAG) 是一种使用真实信息改善LLM输出的技术。这种技术是大多数基于LLM的工具的重要组成部分,大多数RAG方法使用向量相似性作为搜索技术,我们称之为基线RAG。
私有数据集是 LLM 没有接受过训练且以前从未见过的数据,例如企业的专有研究、业务文档或通信。创建 Baseline RAG 是为了帮助解决这个问题,但我们观察到基线 RAG 表现非常糟糕的情况。例如:
Baseline RAG 努力将各个点连接起来。当回答问题需要通过其共享属性遍历不同的信息片段以提供新的综合见解时,就会发生这种情况。
当要求全面理解大型数据集合甚至单个大型文档的摘要语义概念时,基线 RAG 表现不佳。
GraphRAG 是一种结构化的分层检索增强生成 (RAG) 方法,而不是简单的语义搜索 使用纯文本片段的方法。
GraphRAG 流程包括从原始文本中提取知识图谱、构建社区层次结构、为这些社区生成摘要,然后在执行基于 RAG 的任务时利用这些结构。
GraphRAG模式下的AGI
因此,引入GraphRAG后,当用户提问后,同时结合了向量查询和图谱查询,让回答效果更佳。
解析推进阅读:
https://www.zhihu.com/question/59760509/answer/3554247740(朱恩庆的回答)
https://www.zhihu.com/question/59760509/answer/3613307866(沐东风的回答 )
https://www.zhihu.com/question/660806147/answer/3626263679( 叮当猫的回答)
转载本站文章《windows智能化:Microsoft Graph与GraphRAG》,
请注明出处:https://www.zhoulujun.cn/html/tools/cloudServices/Azure/9278.html