作为一个企业网盘产品,我们跟进了相当多的客户使用文档的情况,倾听了各种用户在使用各种文档时的声音,同时也不断改进我们产品以适应客户需求,现代企业网盘的核心就是减少用户重复的繁重而又没有价值的工作,这里简单说几个点,有的我们产品已经解决,有的我们还在优化产品的路上。
寻找文档
企业用户往往有海量的各种版本的文档,而且不同文档散落在不同位置,其实不管是写一个报告或者准备一个标书,大量的工作是在整理寻找文档中。这是文档处理工作中首要需要解决的问题。
企业网盘通过同步、API接口等功能统一存储了企业的几乎所有文档,配合全文搜索可以找到文档内容中的相关关键字,这样已经能很方便的找到文档了。但传统搜索的关键字匹配存在局限性,同时对于图片等非文字素材毫无办法,进入AI时代后,我们有多种方式更准确的让用户寻找文档工作更简便。
例如:使用AI搜索能直接获取到文档中的内容信息,并且可以查找总结网盘中所有文档。
示例:查找营业执照,AI可以直接给出营业执照的信息,并在来源中指向营业执照的文件。

快速找到图片
利用AI还可以通过描述快速找到图片,避免了在一堆素材里找图的痛苦。
譬如:搜索玻璃幕墙,就能把有玻璃幕墙的图片都搜索出来。

获取总结多个文档知识
日常工作往往还有一项搞耗时耗力的需求,就是需要把多个文档中的某些特定信息总结在一个文档或表格里。这项工作不仅麻烦耗时耗力,还容易出错。
AI能完成这项工作么?其实技术角度上来说是可以的,但是很难。因为这项工作有一个重要的点就是要全面准确不能漏项,现有的RAG技术+知识图谱能做到总结多个文档的特定信息,但要做到不能漏项就很难,需要针对特定场景进行一定的优化。
像我们的产品,巴别鸟企业网盘,采用深度搜索技术,能在某种程度上做到覆盖面极广的总结多个文档关键信息。但是,漏掉一些信息的问题一直存在,需要用户后期进行检查,但这也节约了用户80%的时间和精力。我们也相信,随着AI技术的不断发展,这块功能会越来越成熟。
譬如:公司2014年到2019年一共有14项软著,但是巴别鸟智巢AI只总结了12个软著。

撰写文档
写各类文档,总结报告,公众号文章,使用说明….其实也是文档处理工作中的“重复度”较高的工作,也是很多牛马的日常工作之一(譬如我)
AI撰写文档能力已经有目共睹的,但是通常往往需要准备大量材料给AI,同时如果需要效果好,还要花很多时间调优。
能不能简单直接的用AI写出比较高质量的文档呢?
用巴别鸟企业网盘的AI功能就能做到,不同于通用AI,巴别鸟能学习网盘中使用者权限范围内的所有文档,从文档中获取到详细的知识片段,然后生成文章,准确度和可用性高很多。
譬如:生成公号文

使用巴别鸟撰写文章
是不是很强大!!但是,其实这离工作中对文档撰写的要求差很远,还有很多进步空间
日常工作的高价值文档,譬如教师的教案、教学研究报告、考卷,律师的法律文书,专业行业的专业说明,甚至招投标方案、标书….普通的AI和知识库知识图谱技术还是很难胜任的
这就需要根据最终输出的文档要求进行大量调优和测试了,这里的发展空间其实很大。
我们根据客户需求做了一些长文生成智能体,目前也参与到一些对文档撰写要求较高的专业领域的项目中,只能说目前的通用AI产品很难做到生成优质的可用的文章,要高质量的文档还是需要根据最终输出要求对实现方式和AI微调、提示词工程等方面进行定制化。
所以这是一个很有发展前景的方向,譬如:针对某个行业的法律文书撰写、针对某个学科的教材编撰….

提取文档要点
辅助阅读很长的文章,然后把文档中的要点总结出来,或者直接问问题,也可以节约大量查询资料的时间。
这一块AI发展很成熟了,传统优势项目。譬如巴别鸟企业网盘中打开的文件都可以进行AI问答

数据表格分析
财务工作中会有大量的表格数据要查找分析,生成报告或者进行一些筛选和符合查询。这一块也是日常工作中工作量较大的任务。
AI也能很好的处理这些结构化数据表格,也有不少相关产品
这块的难点是对复杂的excel表格进行解析和入库,只要信息能结构化入库还是比较成熟的。
巴别鸟企业网盘的excel分析助理能较好的解决这个问题,并且把手动指定字段入库(这个工作量也不小)做成了自动入库。但是很专业的场景也需要针对性开发。

巴别鸟可以分析excel表格并按要求输出结果
海量文档分类
这也是日常工作中繁重还没啥成就感的活。AI处理这个活也相对比较成熟了,海量文档分类的关键是算力投入和产品设计。
让AI来按它的想法分类显然不现实,所以在我们产品中的实现逻辑是,利用用户设定的标签库来给文档自动分类,譬如用户可以设置一个标签叫“合同”,AI分类文档时,判断一个文件是合同,它就在文档上打合同标签。如果用户标签库中没有“合同”这个标签,AI就是判断出一个文档是合同,也不会打合同标签。这样就把AI分类的类型交给用户来设置,更加准确可用。
这里的主要问题是算力的消耗,如果一个文件夹里有10万个文件,都要用AI来分类,算力成本就会比较高,所以,我们公有云去除了按文件夹进行AI分类的选项,仅可以对单文件或者选中的文件进行分类,私有云因为算力成本用户承担,就可以做到所有文件都自动打标签。

巴别鸟提供了AI自动标签功能来处理分类
最后,我们也很关心这个问题你的答案,如果你在文档处理工作中遇到重复难受没有成就感的工作请告诉我们,作为立志做好企业文档管理产品的一家企业,你的需求就是我们发展的方向。