无题
功能
全文检索
向量检索
智能排产,
主数据清洗:
重复数据的判断(是否是在当前上下文)
品类知识库
规则
多列数据清洗
以GB/T 14885国家标准为框架,结合企业实践建立三级分类体系(大类/中类/小类)
耗时1年完成4000个小类的标准化规则制定,包含:
字段属性规范(数据类型、长度、必填等)
填写逻辑约束(关联字段、业务规则等)
以这些标准为AI提供基础数据
AI数据治理方案:
通过梳理出的规则,构建专有72B大模型+RAG知识库的技术架构
训练领域专用embedding模型提升语义检索准确率
AI文本清洗引擎实现非结构化描述→结构化字段的自动转换
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 HiAsia的小站!
评论