Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 广告合作
  • 赞助一下
  • 关于我们
资源推荐
阿里云优惠券
卓越的云计算技术和服务提供商
腾讯云优惠券
云服务器,云数据库,CDN,域名注册等多种云计算服务
扣子Coze
职场AI,就用扣子
豆包AI
字节跳动旗下 AI 智能助手
即梦AI
一站式智能创作平台,即刻造梦
AiPPT
全智能AI一键生成 PPT
堆友AI
零门槛,多风格AI绘画免费生成,电商海报设计神器
蜂小推
不扣量的项目推广平台
SpeedAI
一键去重、降AIGC率、数据可视化、论文写作

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

WeKnora

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

网站地址:https://weknora.weixin.qq.com
GitHub:https://github.com/Tencent/WeKnora
网站描述:基于大语言模型(LLM)的文档理解与语义检索框架
访问官网
GitHub

WeKnora(维娜拉) 是一款基于大语言模型(LLM)的文档理解与语义检索框架,专为结构复杂、内容异构的文档场景而打造。

框架采用模块化架构,融合多模态预处理、语义向量索引、智能召回与大模型生成推理,构建起高效、可控的文档问答流程。核心检索流程基于 RAG(Retrieval-Augmented Generation) 机制,将上下文相关片段与语言模型结合,实现更高质量的语义回答。


架构设计

WeKnora 采用现代化模块化设计,构建了一条完整的文档理解与检索流水线。系统主要包括文档解析、向量化处理、检索引擎和大模型推理等核心模块,每个组件均可灵活配置与扩展。


核心特性

  • 精准理解:支持 PDF、Word、图片等文档的结构化内容提取,统一构建语义视图
  • 智能推理:借助大语言模型理解文档上下文与用户意图,支持精准问答与多轮对话
  • 灵活扩展:从解析、嵌入、召回到生成全流程解耦,便于灵活集成与定制扩展
  • 高效检索:混合多种检索策略:关键词、向量、知识图谱
  • 简单易用:直观的Web界面与标准api,零技术门槛快速上手
  • 安全可控:支持本地化与私有云部署,数据完全自主可控

适用场景

应用场景具体应用核心价值
企业知识管理内部文档检索、规章制度问答、操作手册查询提升知识查找效率,降低培训成本
科研文献分析论文检索、研究报告分析、学术资料整理加速文献调研,辅助研究决策
产品技术支持产品手册问答、技术文档检索、故障排查提升客户服务质量,减少技术支持负担
法律合规审查合同条款检索、法规政策查询、案例分析提高合规效率,降低法律风险
医疗知识辅助医学文献检索、诊疗指南查询、病例分析辅助临床决策,提升诊疗质量

功能模块能力

功能模块支持情况说明
文档格式支持✅ PDF / Word / Txt / Markdown / 图片(含 OCR / Caption)支持多种结构化与非结构化文档内容解析,支持图文混排与图像文字提取
嵌入模型支持✅ 本地模型、BGE / GTE API 等支持自定义 embedding 模型,兼容本地部署与云端向量生成接口
向量数据库接入✅ PostgreSQL(pgvector)、Elasticsearch支持主流向量索引后端,可灵活切换与扩展,适配不同检索场景
检索机制✅ BM25 / Dense Retrieve / GraphRAG支持稠密/稀疏召回、知识图谱增强检索等多种策略,可自由组合召回-重排-生成流程
大模型集成✅ 支持 Qwen、DeepSeek 等,思考/非思考模式切换可接入本地大模型(如 Ollama 启动)或调用外部 API 服务,支持推理模式灵活配置
问答能力✅ 上下文感知、多轮对话、提示词模板支持复杂语义建模、指令控制与链式问答,可配置提示词与上下文窗口
端到端测试支持✅ 检索+生成过程可视化与指标评估提供一体化链路测试工具,支持评估召回命中率、回答覆盖度、BLEU / ROUGE 等主流指标
部署模式✅ 支持本地部署 / Docker 镜像满足私有化、离线部署与灵活运维的需求
用户界面✅ Web UI + RESTful API提供交互式界面与标准 API 接口,适配开发者与业务用户使用习惯

快速开始

环境要求

确保本地已安装以下工具:

  • Docker
  • Docker Compose
  • Git

安装步骤

克隆代码仓库

# 克隆主仓库
git clone https://github.com/Tencent/WeKnora.git
cd WeKnora

配置环境变量

# 复制示例配置文件
cp .env.example .env

# 编辑 .env,填入对应配置信息
# 所有变量说明详见 .env.example 注释

启动服务

# 启动全部服务(含 Ollama 与后端容器)
./scripts/start_all.sh
# 或
make start-all

启动服务备选

# 启动 ollama 服务 (可选)
ollama serve > /dev/null 2>&1 &

# 启动服务
docker compose up -d

停止服务

./scripts/start_all.sh --stop
# 或
make stop-all

服务访问地址

启动成功后,可访问以下地址:

  • Web UI:http://localhost
  • 后端 API:http://localhost:8080
  • 链路追踪(Jaeger):http://localhost:16686

仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://fly63.com/nav/4683

更多»
热门资源
fly63工具箱
简单、易用、便捷的在线工具
官网
GitHub
remove.bg
消除图片背景:100% 自动 – 只需 5 秒
官网
阿里云DataV
地图数据
官网
retoucher
在线AI智能抠图去背景工具
官网
飞书多维表格
飞书旗下的一款在线协作与业务管理工具
官网
Apifox
API 文档、API 调试、API Mock、API 自动化测试一体化协作平台
官网
易文档
需求文档、API文档、部署文档到使用手册
官网
mdx-deck
基于MDX的演示文稿
官网
GitHub
YouCompress
在线免费文件压缩工具
官网
iHateRegex
快速搜索并匹配到合适的正则表达式
官网
GitHub
Trilium Notes
层级结构的笔记程序,专注构建个人的大型知识库
点击进入
GitHub
CodeZen
在线源代码转图片工具
官网
类似于WeKnora的资源
Clarity
微软出品的网站热图与用户行为分析工具
官网
Corrupt a file
一个能损坏任何类型文件的网站
官网
SAM-Audio
Meta开源的声音分离工具
官网
GitHub
OCRmyPDF
为 PDF 文件转换为可搜索、可复制的文档AI工具
官网
GitHub
PoleBrief
免费简历制作平台
官网
Adobe Kuler
Adobe 官方的在线配色服务
官网
雪碧图工具
减少http请求数,会将大量的图片图片合成一张雪碧图(Sprite)来使用
官网
gitify
桌面上的GitHub通知
官网
GitHub
目录

手机扫一扫预览

》
分享组件加载中...
首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架 实用工具箱 广告合作 关于我们

Copyright © 2018 Web前端开发网提供免费在线工具、编程学习资源(教程/框架/库),内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。