AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器

今天我们来完成一个既有挑战性又有启发性的任务:我们来使用开源的 AI 开发平台 Dify 创建一个高质量的 AI 翻译助手。同时我们可以学习一种可以应用于不同平台的通用的方法。

虽然现在的 AI 翻译比传统的机器翻译提升了很多,但是依然不够令人满意。这就是为什么我们今天要学习一种新的方法来提升翻译的质量。这种方法就是 AI 界大神吴恩达老师最新开源的反思工作流。简单来说它就是一种让 AI 对自己的输出结果进行思考并进一步改进的方法。

反思工作流它的具体步骤实际上就是三步法:先让一个 AI 进行初始翻译打一个草稿,然后再让第二个 AI 去挑毛病,然后再让第三个 AI 对草稿进行最终的优化,形成最后的翻译结果。这就相当于是一个团队作业,三个臭皮匠胜过诸葛亮。这个过程不仅能够提高翻译的准确性,还可以让翻译更加符合目标语言的表达习惯。

在上期智图派,Coze 复刻吴恩达开源 AI 翻译神器 | 「智图派」 当中我使用 Coze 平台来实现过这个翻译的工作流,今天我们将使用另外一个 AI 开发平台 Dify 来再次实现这个工作流。我们可以通过这次实例来学习到如何把同一套思想同一套工作流在不同的平台当中实现。这就好像我常说的电影《神鞭》当中的台词:鞭没了神还在。神就是你的思想、理念和方法,而鞭就是工具。所以就算主角的鞭没了,但是他很快又能成为一名神枪手。

在 AI 开发当中,掌握核心的方法要比依赖于特定的工具更为重要。这种灵活性可以让我们能够去适应不同的平台和不同的工具。

Dify 是一个开源的 AI 智能体和工作流开发平台,可以很轻松地创建聊天助手、AI 工作流等等。它跟扣子的主要区别就是:首先,Dify 是开源而且可以本地部署的,比如我现在的 Dify 就是部署在本地。其次,Dify 使用到的这些 AI 模型,它使用的是你自己的 API Key。所以如果你要用 GPT 或者 Claude 这些模型的话,你需要自己给 API 充值。当然 Dify 它支持很多模型,大家可以去按需来选择。

好,那在接下来的视频当中,你将会学到:

  1. 如何使用 Dify 来快速地创建一个反思翻译工作流来提高翻译质量;
  2. 如何使用 Dify 工作流的迭代功能来针对长文进行分片翻译,突破 AI 模型的 4K 输出上下文的瓶颈;
  3. 反思翻译的工作流的意义在哪里?仅仅是为了翻译吗?

首先我们来看一下长文分片翻译的效果。我已经发了一个推文,30 分钟字幕文本,6551 个 token,用的是 Claude 3.5 Sonnet 的模型,切了 6 片翻译,耗时 6 分钟,耗费 4 毛 8 Dollar,美元。所以成本还是不低,但是你可以用更便宜的模型去尝试。

详细的讲解过程,请观看我的 YouTube 视频: AI 智能体工作流:用 Dify 打造本地、开源长文翻译神器 | 实操教程 | Coze 收费了 | 回到Axton

这期智图派,主要是给大家分享两个工作流的模板文件。

首先是反思翻译工作流的核心流程,也就是用三个 AI 来完成翻译工作。工作流的配置文件我已经在我的免费课程当中分享了,感兴趣的朋友可以通过以下链接加入我的免费课程下载 DSL 文件,导入到 Dify 当中就可以直接使用:Axton 的免费福利分享

只需要输入你的姓名和邮箱,就可以加入到我的免费课程里面。如果你已经加入过了,那么直接点击右上角登录就可以。然后找到 Axton 的免费课程,点击 Access Now 进去。之后在这边的 GPT and AI 智能体的章节下面,我们就会看到 Dify 反思翻译工作流的配置文件。点击上面就是一个下载文件,Download 的标志,点击把它下载回来。这是一个压缩包,然后我们解压缩。双击解压缩以后,就会生成一个 Dify 反思翻译核心工作流,扩展名是 YML 的文件。在 Dify 中导入这个文件就可以。

接下来是加入了长文分片功能的工作流。这个工作流才相当于是完美地复刻了吴恩达老师的开源项目。

那么我们为什么要对长文进行分片翻译呢?有两点。首先第一点,现在的 AI 模型虽然它的 token 上下文窗口 200k、128k 等等都很大,但是它的输出一般都是在 4k。所以你超过 4k token 的一个文章,它就没有办法一次性的输出完成了。这就是你在使用 ChatGPT 也好,或者使用 Claude 也好,他会经常输出一部分就停下来了,你经常需要让它去”继续”,它才能把一个完整的文章给你输出完成的原因。这种方式对于你单独使用没有什么大的问题,但是它就没有办法去融入到你的其他工作流里面去了。

那第二个问题就是你把一篇文章分的稍微小一些,比如说 1000 个字左右的一片,去让 AI 翻译的效果会更好一些。当然这里面也存在一个隐患,就是你的切片的地方如果再连接到一起的时候,它可能会有一定的语义不完整。那这就是之后优化的事情了,我们先不用管它。

整个长文切片的工作,它的重点就是你对分片的一个判断,这边会要用到 Dify 的代码节点。我们重点要学的就是作为一个不会编程的人,我们如何使用自然语言去让 ChatGPT、让 Claude 这些 AI 帮我们写出能够正常运行的代码。另外一个重点就是 Dify 的迭代节点,其实它本身并不很复杂,大家稍微练习一下就可以掌握。

完整的工作流模板链接如下,大家下载后导入到 Dify 中就可以使用了:

Read more

Napkin AI: 一键生成专业图表

Napkin AI: 一键生成专业图表

主题 Napkin AI 工具介绍与使用教程:详细介绍了 Napkin AI 这款能将文本转化为专业图表的工具,并提供了实际操作指南。 AI 辅助内容创作与可视化:探讨了如何利用 AI 工具(如 NotebookLM 和 Napkin AI)来总结视频内容并将其转化为视觉吸引力强的图表。 专业图表在商业展示中的重要性:讨论了高质量图表在商业咨询和演示中的关键作用。 核心要点 * Napkin AI 能将文本自动转化为专业级别的图表,大大提高了内容创作和演示的效率。 * 该工具提供了丰富的自定义选项和高级功能,如 Spark Search 和协作功能,满足不同用户的需求。 * Napkin AI 的出现可能会降低高质量商业展示的成本门槛,使普通用户也能制作出专业水准的图表。 * 尽管目前还处于测试阶段,Napkin AI 展现出了巨大的潜力,预示着内容创作和信息可视化领域的变革。 洞见 Napkin AI 代表了一种新兴的"专业技能"趋势。

By Axton
Claude 新功能超越 ChatGPT?

Claude 新功能超越 ChatGPT?

主题 Claude最新数据分析功能发布与ChatGPT对比: 详细介绍了Claude新推出的数据分析功能,并与ChatGPT的高级数据分析功能进行了对比测试。 AI公司之间的竞争: 分析了Anthropic(Claude)和OpenAI(ChatGPT)在功能更新方面的竞争态势。 大型语言模型的数据处理能力: 探讨了Claude和ChatGPT在处理不同规模数据文件时的表现和局限性。 核心要点 * Claude新推出的数据分析功能能够处理CSV文件并生成交互式图表,展示了大语言模型在数据科学领域的应用潜力。 * Anthropic通过连续推出新功能,包括数据分析工具,似乎在直接挑战OpenAI的市场地位,反映了AI公司间激烈的竞争态势。 * 虽然Claude在图表交互性和视觉效果上表现出色,但在数据处理能力和全面性上仍落后于ChatGPT的高级数据分析功能。 * 大型语言模型正在向多功能、集成化方向发展,不再局限于纯文本处理,而是扩展到数据分析、可视化等领域。 洞见 AI公司间的功能竞争正在推动"AI即服务"(AIaaS)生态系统的快速演变。随着像Claude

By Axton
Claude 3.5: AI 自主操作电脑

Claude 3.5: AI 自主操作电脑

主题 Claude的新功能 - AI操作计算机: 介绍了Anthropic公司最新发布的Claude 3.5 Sonnet模型,能够按照用户指令操作计算机,包括移动光标、点击和输入信息。 AI操作计算机的意义与影响: 分析了这项功能对人工智能发展的重大意义,以及可能对人类工作产生的影响。 Claude在计算机操作测试中的表现: 详细介绍了Claude在计算机操作能力评估中的表现,与人类和其他AI模型进行了对比。 AI与现有工具的融合: 讨论了AI如何与现有计算机环境和工具相融合,以及这种融合对未来自动化发展的影响。 核心要点 * Claude 3.5 Sonnet模型展示了AI操作计算机的能力,标志着人工智能向AGI迈进的重要一步。 * AI操作计算机的能力源于多模态技术和工具使用研究的结合,展现了AI在复杂任务中的应用潜力。 * 虽然Claude在计算机操作测试中的表现(14.9%)远低于人类水平,但已大幅领先于其他AI模型,预示着未来快速进步的可能性。 * AI与现有计算机环境的融合代表了一种新趋势,即AI开始适应现有工具,而非工具适应AI。 * 这项技术的

By Axton