AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器
今天我们来完成一个既有挑战性又有启发性的任务:我们来使用开源的 AI 开发平台 Dify 创建一个高质量的 AI 翻译助手。同时我们可以学习一种可以应用于不同平台的通用的方法。
虽然现在的 AI 翻译比传统的机器翻译提升了很多,但是依然不够令人满意。这就是为什么我们今天要学习一种新的方法来提升翻译的质量。这种方法就是 AI 界大神吴恩达老师最新开源的反思工作流。简单来说它就是一种让 AI 对自己的输出结果进行思考并进一步改进的方法。
反思工作流它的具体步骤实际上就是三步法:先让一个 AI 进行初始翻译打一个草稿,然后再让第二个 AI 去挑毛病,然后再让第三个 AI 对草稿进行最终的优化,形成最后的翻译结果。这就相当于是一个团队作业,三个臭皮匠胜过诸葛亮。这个过程不仅能够提高翻译的准确性,还可以让翻译更加符合目标语言的表达习惯。
在上期智图派,Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」 当中我使用 Coze 平台来实现过这个翻译的工作流,今天我们将使用另外一个 AI 开发平台 Dify 来再次实现这个工作流。我们可以通过这次实例来学习到如何把同一套思想同一套工作流在不同的平台当中实现。这就好像我常说的电影《神鞭》当中的台词:鞭没了神还在。神就是你的思想、理念和方法,而鞭就是工具。所以就算主角的鞭没了,但是他很快又能成为一名神枪手。
在 AI 开发当中,掌握核心的方法要比依赖于特定的工具更为重要。这种灵活性可以让我们能够去适应不同的平台和不同的工具。
Dify 是一个开源的 AI 智能体和工作流开发平台,可以很轻松地创建聊天助手、AI 工作流等等。它跟扣子的主要区别就是:首先,Dify 是开源而且可以本地部署的,比如我现在的 Dify 就是部署在本地。其次,Dify 使用到的这些 AI 模型,它使用的是你自己的 API Key。所以如果你要用 GPT 或者 Claude 这些模型的话,你需要自己给 API 充值。当然 Dify 它支持很多模型,大家可以去按需来选择。
好,那在接下来的视频当中,你将会学到:
- 如何使用 Dify 来快速地创建一个反思翻译工作流来提高翻译质量;
- 如何使用 Dify 工作流的迭代功能来针对长文进行分片翻译,突破 AI 模型的 4K 输出上下文的瓶颈;
- 反思翻译的工作流的意义在哪里?仅仅是为了翻译吗?
首先我们来看一下长文分片翻译的效果。我已经发了一个推文,30 分钟字幕文本,6551 个 token,用的是 Claude 3.5 Sonnet 的模型,切了 6 片翻译,耗时 6 分钟,耗费 4 毛 8 Dollar,美元。所以成本还是不低,但是你可以用更便宜的模型去尝试。
详细的讲解过程,请观看我的 YouTube 视频: AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器 | 实操教程 | Coze 收费了 | 回到Axton
这期智图派,主要是给大家分享两个工作流的模板文件。
首先是反思翻译工作流的核心流程,也就是用三个 AI 来完成翻译工作。工作流的配置文件我已经在我的免费课程当中分享了,感兴趣的朋友可以通过以下链接加入我的免费课程下载 DSL 文件,导入到 Dify 当中就可以直接使用:Axton 的免费福利分享
只需要输入你的姓名和邮箱,就可以加入到我的免费课程里面。如果你已经加入过了,那么直接点击右上角登录就可以。然后找到 Axton 的免费课程,点击 Access Now 进去。之后在这边的 GPT and AI 智能体的章节下面,我们就会看到 Dify 反思翻译工作流的配置文件。点击上面就是一个下载文件,Download 的标志,点击把它下载回来。这是一个压缩包,然后我们解压缩。双击解压缩以后,就会生成一个 Dify 反思翻译核心工作流,扩展名是 YML 的文件。在 Dify 中导入这个文件就可以。
接下来是加入了长文分片功能的工作流。这个工作流才相当于是完美地复刻了吴恩达老师的开源项目。
那么我们为什么要对长文进行分片翻译呢?有两点。首先第一点,现在的 AI 模型虽然它的 token 上下文窗口 200k、128k 等等都很大,但是它的输出一般都是在 4k。所以你超过 4k token 的一个文章,它就没有办法一次性的输出完成了。这就是你在使用 ChatGPT 也好,或者使用 Claude 也好,他会经常输出一部分就停下来了,你经常需要让它去”继续”,它才能把一个完整的文章给你输出完成的原因。这种方式对于你单独使用没有什么大的问题,但是它就没有办法去融入到你的其他工作流里面去了。
那第二个问题就是你把一篇文章分的稍微小一些,比如说 1000 个字左右的一片,去让 AI 翻译的效果会更好一些。当然这里面也存在一个隐患,就是你的切片的地方如果再连接到一起的时候,它可能会有一定的语义不完整。那这就是之后优化的事情了,我们先不用管它。
整个长文切片的工作,它的重点就是你对分片的一个判断,这边会要用到 Dify 的代码节点。我们重点要学的就是作为一个不会编程的人,我们如何使用自然语言去让 ChatGPT、让 Claude 这些 AI 帮我们写出能够正常运行的代码。另外一个重点就是 Dify 的迭代节点,其实它本身并不很复杂,大家稍微练习一下就可以掌握。
完整的工作流模板链接如下,大家下载后导入到 Dify 中就可以使用了: