无题
知识图谱方向前景不好->切换到大模型
线下永康-南龙集团,正阳电
通用模型-训练RAG
营销 -> 国内,外贸
产品库
量小走知识库
textToSql
竞品目标库
爬虫(国外网站比较好)
1v1
产品与产品 对标
1vN
OEM,ODM.拆分成多个
介入PLM系统
幻觉DS-R1幻觉较高,严谨需要V3.有幻觉排行测试集->批量测试
底层RagFlow,Dify程序批量优化
图片适配多模态模型,训练,打标系统
图片生成SD-Trainer打标2000(3w-6w)->训练模型LoRa->生图Flux,SD
图像识别算法计算工艺成本分割模型人是怎么识别的,训练数据给到模型
确认流程->AI接受程度视频模型控制变形ComfyUI->Control lite
数据报表textToSQL
审核模型智能表格对接工作流API知识图谱静态资源 做知识图谱动态的数据 旧数据,新数据如何管理
一个工作有多少交付物每一个交付物 工作的流程,哪个流程可以用AI接入
生产装备研发部-选品模型结构化提示词数据清洗
无题
作业代码aici100(多角贸易流程设置作业)最少为两个据点
正抛销售价
逆抛生产价
多角汇率-转换可能有问题
多角汇率一样
无题
功能全文检索向量检索
智能排产,
主数据清洗:重复数据的判断(是否是在当前上下文)品类知识库规则多列数据清洗
以GB/T 14885国家标准为框架,结合企业实践建立三级分类体系(大类/中类/小类)耗时1年完成4000个小类的标准化规则制定,包含:字段属性规范(数据类型、长度、必填等)填写逻辑约束(关联字段、业务规则等)以这些标准为AI提供基础数据AI数据治理方案:通过梳理出的规则,构建专有72B大模型+RAG知识库的技术架构训练领域专用embedding模型提升语义检索准确率AI文本清洗引擎实现非结构化描述→结构化字段的自动转换
无题
优先实现:研发部门,工厂工艺,HR部门,IT部门
知识采集的质量.
自动采集的方式
显性知识 + 隐形知识
权限(预览,下载,编辑,删除,管理)
问答可以自动判断权限如何对接外部模型/知识库?
知识发现 识别
上传文件/网盘挑选
在线编辑
ORC识别
审核
提高RAG的召回率
处理文本给AI使用
机器识别模型.帮助整理知识
通过摄像头 获取原始数据(通过专家标注)
制造业的知识结构(目录)–学习经验
各个部门的知识汇集
与鸿翼 沟通需求 提要求
鸿翼功能
企业库
部门库->二级库
工程建模文件如何让ai识别? QA对/操作指令
CAD图如何结合标注识别?
AI翻译版本对比.–无功能?
研究院
文档分类有很多种.
评审(共识)
知识图谱-微软Graph
相关内容-相似关联
标签关联
AI场景合同智能审核
无题
RAG 技术原理解析
Huggingface 向量模型排行榜访问地址 https://huggingface.co/spaces/mteb/leaderboard
向量模型的种类向量模型的种类大概分为六大类,向量模型的数量有上百种以上
BERT 是一种基于 Transformer 架构的预训练语言表示模型,被广泛应用情感分析、问答系统、命名实体识别等场景。
M3E 通过大规模混合嵌入技术提高了词向量的表达能力和泛化能力,适用于各种文本处理任务
BGE 是一种基于双向生成编码的深度学习模型,主要用于将文本数据编码为高维向量表示,适用于文本相似度计算、信息检索、聚类和分类等。
Sentence Transformers - 基于孪生 BERT 网络预训练得到的模型,对句子的嵌入效果比较好
OpenAI Embedding - OpenAI Embedding 向量模型是一种将文本转换为高维向量表示的技术,适用于搜索引擎、推荐系统、问答系统等场景。
Instructor Embedding - Instructor Embedding 向量模型提供任务指令而生成相对定制化的文本嵌入向量,无 ...
无题
部署-可以使用(宣传)
阶段性成果(宣传)
目标和产出
精进会议(每个领域的技术)
能不能做
试点-测试验证
推广
收集需求->评审->要货计划->下订单给计划->人员跟踪生产(MES线上)->生产完成入库->中台系统上架->经销商下单->生成订单->大区经理审核->财务审核->抛转T100(无法识别永康还是临安)手工备注->仓库发货(发货单号)
ToB消退 无问题
产品领用BPM产品领用(为什么系统不能自动领用)
ToC库存都在万里牛
下单->万里牛发货->每天晚上12点自动抛转T100->出库浙哈->贸易公司->消费者
库存在杭哈 -> 浙哈 -> 贸易公司 -> 消费者
发货->物流单据->同步到系统
单个人员加班严重客服人工客服开发页面->打通各个店铺鉴权
AI客服提高效率和准确率晓多智能客服 6-7w接 入: 淘宝,天猫没接入:有赞,1688,小红书,微店
评审会 AI创新大赛发公告价值,对应的数据,实施难度
无题
GROF RAG
微软开源的知识库框架graphdify 赶紧玩起来保温杯行业趋势爬取搜索引擎->插入数据库->总结行业报告->每日推送给企微
1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162flowchart LR %% 样式定义 classDef in fill:#d4f7d4,stroke:#2db92d; classDef out fill:#f7d4d4,stroke:#c91010; %% 产品管理模块 subgraph product_mgmt[产品管理] A["产品基础信息 (sys_product)"] end %% 仓库管理模块 subgraph warehouse_mgmt[仓库管理] B["仓库档案 (warehouse)"] C[&qu ...
无题
一.安装插件官方下载地址CodeGPT:https://docs.tryproxy.io/通义千问灵码:https://help.aliyun.com/zh/lingma/product-overview/introduction-of-tongyi-lingmaIDEA与VSCode也可直接在插件市场搜索下载CodeGPT, TONGYI Lingma
二.配置CodeGPT1.配置硅基流动的API keyurl:https://api.siliconflow.cn/v1/chat/completionsAPI-key:sk-oukpmyazjsudhwfstvzxokjuqxlzgfuzgjurtbdustnkttfd
2.选择对应的模型Model:deepseek-ai/DeepSeek-V2.5也可以选择自己需要的模型
3.设置Prompts最后加上提示词Finally answer me in Chinese.
到此就可以愉快的使用了!
无题
以下是一个简短的培训大纲,涵盖RAG知识库构建、日常规范和企业流程文件导入,以及智能问答助手的构建:
培训大纲:RAG知识库构建与智能问答助手开发
RAG技术概述
什么是RAG(检索增强生成)?
RAG的优势与应用场景。
RAG与传统问答系统的区别。
RAG知识库构建
数据准备与清洗:
日常规范文件(如员工手册、合规文档)。
企业流程文件(如SOP、工作流程图)。
文档分块与向量化:
文本分块策略(chunking)。
嵌入模型(Embedding Model)的选择与使用。
向量数据库的选择与搭建:
常见工具(如FAISS、Chroma、Pinecone)。
数据索引与存储。
知识库内容导入与管理
支持的文件格式(PDF、Word、Excel、Markdown等)。
自动化导入工具与脚本。
知识库的更新与维护机制。
智能问答助手的构建
检索模块的实现:
相似度搜索与排序。
生成模块的实现:
大语言模型(LLM)的选择(如GPT、Claude、本地模型)。
Prompt工程优化。
案例演示与实操
从零构建一个简单的企业智能问答助手。
...