每天 Shaarli

一天内的所有链接,汇聚在一个页面上。

November 10, 2024

netease-youdao/QAnything:基于Anything的问答。

QAnything 是什么?
QAnything(基于任何事物的问答)是一个本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。
有了QAnything,您只需放置任何格式的本地存储文件即可获得准确、快速、可靠的答案。
目前支持的格式包括:PDF(pdf)、Word(docx)、PPT(pptx)、XLS(xlsx)、Markdown(md)、电子邮件(eml)、TXT(txt)、图像(jpg,jpeg,png)、CSV(csv)、网页链接(html),更多格式即将推出……
主要特色
数据安全,支持全程拔网线安装和使用。
支持多种文件类型,解析成功率高,支持跨语言问答,中英文问答自由切换,不受文件语言影响。
支持海量数据问答,两级向量排序,解决大规模数据检索降级问题,数据越多效果越好,上传文件个数无限制,检索速度快。
硬件友好,默认运行在纯CPU环境中,支持Windows、Mac、Linux等多平台,除了Docker之外没有其他依赖。
界面友好,无需繁琐配置,一键安装部署,即装即用,各个依赖组件(PDF解析、OCR、嵌入、rerank等)完全独立,支持自由替换。
支持类似Kimi的快速启动模式、无文件聊天模式、仅检索模式、自定义Bot模式。

https://github.com/TeamWiseFlow/awada

功能与特性
🌐 同时支持个人微信(基于 wxbot)和企业微信(基于句子互动服务)。
📚 支持来自群聊分享、公众号订阅、网站的在线自主学习(能力来自开源项目 wiseflow)。
📄 支持自主上传 .md, .txt, .pdf, .jpg, .png, .jpeg, .docx, .xlsx, .pptx, .eml, .csv 等格式的文档,并提供智能文档解析、动态存储、检索以及 RAG 能力(能力来自网易有道开源项目 Qanything)。
🤖 兼容任何 OpenAI 消息格式的 LLM 服务,无论是本地部署服务还是在线 MaaS 服务。
🔒 在使用本地 LLM 服务的情况下,可实现完全的本地私有化部署。
🧩 一个微信账号可以化身为多bot分身,分别配置以同时服务多个不同团队,且相互数据隔离。
🚀 全异步架构,高并发支持。
📰 除资料查找、问答、写作功能外,还提供基于私域知识库的每日简报功能。

TeamWiseFlow/wiseflow: Wiseflow是一款敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种来源提取简洁的消息,自动分类并上传到数据库。

🚀 首席情报官(Wiseflow)是一个敏捷的信息挖掘工具,可以从网站、微信公众号、社交平台等各种信息源中按设定的关注点提炼讯息,自动做标签归类并上传数据库。
我们缺的其实不是信息,我们需要的是从海量信息中过滤噪音,从而让有价值的信息显露出来
🌱看看首席情报官是如何帮您节省时间,过滤无关信息,并整理关注要点的吧!🌱
✅ 通用网页内容解析器,综合使用统计学习(依赖开源项目GNE)和LLM,适配90%以上的新闻页面;
✅ 异步任务架构;
✅ 使用LLM进行信息提取和标签分类(最低只需使用9B大小的LLM就可完美执行任务)!