通过容器启动QAnything知识库问答系统

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。目前已支持格式:PDF(pdf)Word(docx)PPT(pptx)XLS(xlsx)Markdown(md)电子邮件(eml)TXT(txt)图片(jpg,jpeg,png)CSV(csv)网页链接(html)等格式。

一.后端启动

1.run.sh命令启动

因为显卡配置原因,没有使用Qwen-7B-QAnything模型,而使用了MiniChat-2-3B模型,启动命令bash ./run.sh -c local -i 0 -b hf -m MiniChat-2-3B -t minichat。其中参数物理意义如下所示:

参数解释
-c用于指定 llm API 模式的选项,可以选择 localcloud。默认是 local。如果设置为 -c cloud,则需要先手动将环境变量 {OPENAI_API_KEY, OPENAI_API_BASE, OPENAI_API_MODEL_NAME, OPENAI_API_CONTEXT_LENGTH} 设置到 .env 文件中。
-i用于指定 GPU 设备 ID。
-b用于指定 LLM 推理运行时后端,选项包括 defaulthfvllm
-m用于指定使用 FastChat serve API 加载 LLM 模型的路径,选项包括 Qwen-7B-Chatdeepseek-llm-7b-chat 等。
-t用于指定使用 FastChat serve API 时,根据 LLM 模型的对话模板,选项包括 qwen-7b-chatdeepseek-chat 等。

更加完整的QAnything服务启动命令使用,如下所示:

为了使用更多LLM,需要在/path/to/QAnything/third_party/FastChat/fastchat/conversation.py中配置conv_template。支持使用 FastChat API 与 Huggingface Transformers/vllm 运行时后端的公共大型语言模型(LLM),如下所示:

2.启动成功日志

如果想要查看相关日志,请查看QAnything/logs/目录下的日志文件,如下所示:

序号日志文件解释
1debug.log用户请求处理日志
2sanic_api.log后端服务运行日志
3llm_embed_rerank_tritonserver.log(单卡部署)LLM embedding和rerank tritonserver服务启动日志
4llm_tritonserver.log(多卡部署)LLM tritonserver服务启动日志
5embed_rerank_tritonserver.log(多卡部署或使用openai接口)embedding和rerank tritonserver服务启动日志
6rerank_server.logrerank服务运行日志
7ocr_server.logOCR服务运行日志
8npm_server.log前端服务运行日志
9llm_server_entrypoint.logLLM中转服务运行日志
10fastchat_logs/*.logFastChat服务运行日志
11qa_logs/qa.log问答服务运行日志

3.启动成功容器

容器名称解释
qanything-container-local这是一个运行 qanything 应用的容器。qanything 是一个基于深度学习的对话系统,可以处理各种对话任务。在这个容器中,qanything 应用会根据环境变量的设置,选择本地或云端的模型进行运行。
milvus-standalone-local这是一个运行 milvus 的容器。milvus 是一个开源的向量数据库,用于处理大规模的向量检索和相似性搜索。在这个容器中,milvus 以单机模式运行。
milvus-minio-local这是一个运行 minio 的容器。minio 是一个高性能的开源对象存储服务器,用于存储非结构化的数据,如图片、视频、日志文件等。在这个容器中,minio 用于存储 milvus 的数据。
mysql-container-local这是一个运行 mysql 的容器。mysql 是一个关系型数据库管理系统,用于存储结构化的数据。在这个容器中,mysql 用于存储应用的数据。
milvus-etcd-local这是一个运行 etcd 的容器。etcd 是一个开源的分布式键值存储系统,用于共享配置和服务发现。在这个容器中,etcd 用于存储 milvus 的配置信息。

二.前端启动

1.npm命令启动

前端启动命令分别为npm installnpm run dev,如下所示:

2.启动成功界面

3.新建知识库

新建知识库后,上传文件,就可以和知识库进行对话了,如下所示:

三.部署问题

1.CUDA驱动版本更新

在部署QAnything过程中遇到的最大问题是NVIDIA Driver问题,但是没在意这个问题,后面部署失败,升级后基本就成功了。

ERROR: This container was built for NVIDIA Driver Release 530.30 or later, but version 522.06 was detected and compatibility mode is UNAVAILABLE.

2.通过GeForce Experience升级驱动

通过GeForce Experience升级驱动为最新版本,如下所示:

说明:驱动升级完毕后,重启电脑,然后重新运行run.sh命令。

参考文献

[1] QAnything GitHub:https://github.com/netease-youdao/QAnything

[2] QAnything HuggingFace:https://huggingface.co/netease-youdao/QAnything

[3] Ant Design Vue:https://www.antdv.com/components/overview-cn/

[4] Node.js下载地址:https://nodejs.org/dist/v18.16.0/

[5]前端开发文档:https://github.com/ai408/QAnything/blob/master/front_end/README.md

[6] QAnything接口文档:https://github.com/netease-youdao/QAnything/blob/master/docs/API.md

[7] QAnything中文介绍:https://github.com/netease-youdao/QAnything/blob/master/README_zh.md

[8] 有道智云AI开放平台:https://ai.youdao.com/DOCSIRMA/html/aigc/api/qanything/index.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/762592.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

操作配置文件保存方式(上位机)

上位机:(Supervisor Control) 指的是用于监视和控制其他设备或者系统的计算机,在工业自动化和过程控制领域 上位机典型就是一台PC或者服务器,用于语各种下位机进行通信的,收集数据,并且根据收集的数据发送一些数据。 典型的设备…

一文讲懂npm link

前言 在本地开发npm模块的时候,我们可以使用npm link命令,将npm 模块链接到对应的运行项目中去,方便地对模块进行调试和测试 用法 包链接是一个两步过程: 1.为依赖项创建全局软链npm link。一个符号链接,简称软链&a…

为什么127.0.0.1和localhost之间算跨域?

原文:https://mp.weixin.qq.com/s/4zJBMNEntwjqAfN6A6diUA 什么是同源策略、跨域 跨域问题是指在浏览器中,当一个网页向不同域名、不同端口或不同协议的资源发起请求时,会受到限制。这是由浏览器的**同源策略(Same-Origin Policy…

沉浸感拉满的三模游戏外设神器!谷粒金刚3 Pro游戏手柄开箱试玩

沉浸感拉满的三模游戏外设神器!谷粒金刚3 Pro游戏手柄开箱试玩 哈喽小伙伴们好,我是Stark-C~ 对于喜欢打游戏的玩家来说,一款得力的游戏外设绝对是提升游戏体验,增加游戏乐趣的重要神器!而在众多的外设中&#xff0c…

Redis基础教程(六):redis 哈希(Hash)

💝💝💝首先,欢迎各位来到我的博客,很高兴能够在这里和您见面!希望您在这里不仅可以有所收获,同时也能感受到一份轻松欢乐的氛围,祝你生活愉快! 💝&#x1f49…

tkinter实现进度条

tkinter实现进度条 效果代码解析导入需要的模块定义进度条 代码 效果 代码解析 导入需要的模块 import tkinter as tk from tkinter import ttk定义进度条 def start_progress():progress[value] 0max_value 100step 10for i in range(0, max_value, step):progress[valu…

基于大数据架构的情感分析

1 项目介绍 1.1 研究目的和意义 随着大数据时代的到来,电影产业积累了海量的用户评论数据,这些数据中蕴含着观众的情感倾向与偏好信息,为电影推荐和市场策略制定提供了宝贵资源。然而,如何高效地从这浩瀚的数据海洋中提炼出有价…

Linux高并发服务器开发(八)Socket和TCP

文章目录 1 IPV4套接字结构体2 TCP客户端函数 3 TCP服务器流程函数代码粘包 4 三次握手5 四次挥手6 滑动窗口 1 IPV4套接字结构体 2 TCP客户端 特点:出错重传 每次发送数据对方都会回ACK,可靠 tcp是打电话的模型,建立连接 使用连接 关闭连接…

论文阅读《U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation》

Abstract U-Net 已成为图像分割和扩散概率模型等各种视觉应用的基石。虽然通过结合transformer或 MLP,U-Net 已经引入了许多创新设计和改进,但仍然局限于线性建模模式,而且可解释性不足。为了应对这些挑战,我们的直觉受到了 Kolm…

PCL 基于点云RGB颜色的区域生长算法

RGB颜色的区域生长算法 一、概述1.1 算法定义1.2 算法特点1.3 算法实现二、代码示例三、运行结果🙋 结果预览 一、概述 1.1 算法定义 点云RGB区域生长算法: 是一个基于RGB颜色信息的区域生长算法,用于点云分割。该算法利用了点云中相邻点之间的颜色相似性来将点云分割成…

WCCI 2024开幕,横滨圣地巡礼,畅游动漫与美食的世界

惊喜!WCCI 2024开幕,横滨圣地巡礼!畅游动漫与美食的世界 会议之眼 快讯 会议介绍 IEEE WCCI(World Congress on Computational Intelligence)2024,即2024年IEEE世界计算智能大会,于6月30日至…

力扣53. 最大子数组和(动态规划)

Problem: 53. 最大子数组和 文章目录 题目描述思路及解法复杂度Code 题目描述 思路及解法 1.定义dp数组:dp[i]表示以nums[i]为结尾的子序列的最大子序列和; 2.状态初始化:dp[0] nums[0],表示以nums[0]为结尾的子序列的最大子序列和为nums[0]…

linux配置ssh免密登录

1、准备工作 操作系统版本:UnionTech OS Server 20 1050e 内核版本:Linux 4.19.90-2201.4.0.0135.up1.uel20.x86_64 x86_64 使用root用户分别修改每台机器的hosts,添加每台机器所对应的IP和主机名 vi /etc/hosts添加如下内容 172.16.100.1…

Redis-分布式锁(基本原理和不同实现方式对比)

文章目录 1、基本原理2、不同实现方式 1、基本原理 分布式锁:满足分布式系统或集群模式下多进程可见并且互斥的锁。 分布式锁的核心思想就是让大家都使用同一把锁,只要大家使用的是同一把锁,那么我们就能锁住线程,不让线程进行&am…

生命在于学习——Python人工智能原理(3.1.1)

Python部分结束了,开始概率论部分 一、概率基本知识 1.1 事件与概率 1.1.1 事件的运算与关系 (一)基本概念 定义1 随机试验 如果一个试验满足如下条件: 在试验前不能断定其将发生什么结果,但可明确指出或说明试验…

Hugging Face发布重量级版本:Transformer 4.42

Hugging Face 宣布发布Transformer 4.42,该版本为流行的机器学习库带来了许多新功能和增强功能。此版本引入了几个高级模型,支持新工具和检索增强生成 (RAG),提供 GGUF 微调,并整合了量化的 KV 缓存&#x…

可以显示余弦函数的自定义控件

序言 终于把坐标系变化怎么玩,搞清楚了。随手写一个余弦函数的自定义控件。只有70行。 代码 package com.example.myapplication;import android.content.Context; import android.graphics.Canvas; import android.graphics.Color; import android.graphics.Pai…

【Emacs Verilog mode保姆级的使用指南】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者,CSDN实力新星,CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共…

# [0701] Task05 策略梯度、Actor-critic 算法

easy-rl PDF版本 笔记整理 P4、P9 joyrl 比对 补充 P9 - P10 相关 代码 整理 最新版PDF下载 地址:https://github.com/datawhalechina/easy-rl/releases 国内地址(推荐国内读者使用): 链接: https://pan.baidu.com/s/1isqQnpVRWbb3yh83Vs0kbw 提取码: us…

深度学习 --- stanford cs231学习笔记八(训练神经网络之dropout)

6,dropout 6,1 线性分类器中的正则化 在线性分类器中,我们提到过正则化,其目的就是为了防止过度拟合。例如,当我们要用一条curve去拟合一些散点的数据时,常常是不希望训练出来的curve过所有的点&#xff0c…