RAG文档处理中的数值图表和流程图如何解析?
最近琢磨的事情,就是现在很多文档场景,其实本质上都是做的数字化的过程,核心是从不可编辑到可编辑,比如常见的表格解析、文档转markdown、docx等。
最近琢磨的事情,就是现在很多文档场景,其实本质上都是做的数字化的过程,核心是从不可编辑到可编辑,比如常见的表格解析、文档转markdown、docx等。
因此,讲两件事,一个是回顾下小模型,推荐一个写的很好的小模型进展技术总结综述,里面提到的几个关键点都值得索引;再看小模型用于RAG文本切分的一些小模型工具,包括文档处理、文档切分等。