在没有ai的时代,光学工程师想要把一整个公司的专利全部下载并将里面的各种数据整理成表格是一件非常麻烦的事情,而在ai时代,利用ai agent智能体,以往需要一整天的工作可能十分钟就能解决。
小编对编程也是一知半解,错误的地方各位大佬包涵。
我理解的skill
skill:将你的操作流程记住,下一次出现相关提示词的时候调用。
skill存放地址:
该案例前置条件:
1.配置python环境,用deepseek v4 pro或者更强的付费大模型。
2.安装 tesseract-ocr + pytesseract ,用于图片提取文字,配置到系统 PATH 环境变量。
3.配置网络环境,方便爬取谷歌学术的专利。
因为爬取专利的skill不完善,而且考虑可能涉及到的侵权问题,这里只给出训练这个skill的方案和效果演示:
完成上述配置后,输入提示词
最终输出:
需要烧tokens不停地debug,而且不同大模型效果不一样,不过小编全程没打过一个代码,全是让智能体自动debug,完成后让ai 生成skills方便下次调用或者异地部署。
生成的skills:
如果不想自己调试,或者怎么也调不出满意的效果,小编将提供一个skill方便下载,这个skill没有爬取专利功能(规避潜在的侵权等风险),输入提示词能将对应的单个或者多个pdf转换成表格,经过小编多次调试,烧掉了大量tokens,并进行了异地部署测试,效果可靠。
下面是patent-pdf-to-excel 的使用方法与效果,
将patent-pdf-to-excel和pdf-analyze配置到如下目录:
使用训练好的patent-pdf-to-excel skill进行专利信息提取。
提示词:
实现效果:
能将镜头专利(中-日-英 三语均可)生成为八个中文分页。
部分分页效果:
条件式:
镜头数据: