用 GenAI 和 KNIME 制作并发送每日新闻摘要,超简单!

B站影视 电影资讯 2025-04-25 18:18 1

摘要:不管你是需要时刻关注市场动态的金融从业者,还是只想快速知晓天下事的普通人,紧跟世界新闻动态有时会让人觉得压力山大。别担心,这篇教程就来教你打造一个由AI驱动的新闻摘要小助手,它能自动从靠谱的新闻源收集消息,整理成简洁又有用的内容,还能直接发到你的邮箱里。


不管你是需要时刻关注市场动态的金融从业者,还是只想快速知晓天下事的普通人,紧跟世界新闻动态有时会让人觉得压力山大。别担心,这篇教程就来教你打造一个由 AI 驱动的新闻摘要小助手,它能自动从靠谱的新闻源收集消息,整理成简洁又有用的内容,还能直接发到你的邮箱里。

KNIME是一款免费的开源数据科学工具,就算你不太会写代码,也能用它的可视化工作流程搭建各种应用程序。搭配上 AI 扩展功能,它就能帮我们实现自动生成个性化新闻摘要啦,让你省时又能轻松掌握时事热点。

下面就来看看具体怎么操作吧!

一、自动化新闻摘要与分发的实现步骤

我们的目标是每天自动制作并发送新闻摘要,这个过程主要分三步:

从像公共广播公司这类可靠的地方收集世界新闻,然后筛选出每个媒体的前五条重要新闻。

借助大语言模型(LLM)和生成式人工智能(GenAI),把这些新闻整理成清晰、简短的摘要。

把整理好的摘要做成有条理的报告,再自动通过邮件发送出去。这样,我们就能高效又个性化地了解全球发生的新鲜事儿啦!

二、制作并发送新闻摘要的详细流程

步骤 1:获取新闻数据 - 从 某媒体a 和 某媒体b 抓取新闻

在 KNIME 里,我们可以做两个专门的小模块,用来从 某媒体a和某媒体b的网站上抓取新闻数据。

先用到 “Webpage Retriever” 节点,它就像一个勤劳的小搬运工,能把新闻页面的内容变成 XML 文件。XML 文件是一种很有规律的格式,就像把网页数据整整齐齐地放在一个分层的架子上,方便我们找到并拿走想要的部分。

接下来,“XPath” 节点就派上用场啦!它能像一把精准的小镊子,把新闻里的关键信息,比如文章的网址、正文内容、标题还有发布时间都提取出来。我们只挑选出这两个媒体网站上热度最高的前五篇文章。

用同样的方法,从某媒体b 网站也抓取新闻数据,这样就能得到两个装满新闻信息的 “小盒子”(结构化表格)。最后,再用 “Concatenate” 节点把这两个 “小盒子” 合并起来,就得到了一个包含 10 篇新闻文章的数据集,准备进入下一步啦!

步骤 2:让大语言模型写摘要 - 用 OpenAI 的 GPT-3.5-turbo 总结新闻

要想用 GenAI 把新闻整理成摘要,我们得先给 KNIME 装上 AI 扩展功能,然后选一个最适合这个任务的扩展。像 OpenAI 的 GPT-3.5-turbo 就很不错,当然,也有其他选择,比如一些开源的本地模型。

要和 GPT-3.5-turbo “交朋友”(建立连接),需要这么做:

在 “Credentials Configuration” 节点里,输入你的 OpenAI API 密钥,这就像是一把特殊的钥匙,用来打开和 GPT-3.5-turbo 交流的大门。

用 “OpenAI Authenticator” 节点验证一下身份,确保是你本人在和它 “聊天”。

再通过 “OpenAI 聊天模型连接器” 节点,成功连接到 GPT-3.5-turbo 模型。

连接好之后,就可以用 “Expression(表达式)” 节点来写 “小纸条”(设计提示)给 GPT-3.5-turbo 啦。写 “小纸条” 的时候,要告诉它扮演一个很懂世界新闻的热心小助手。还可以给它设定一个字数限制,比如最多回复 100 个 “词块”(令牌),这样就能保证总结出来的内容简洁明了。

另外,为了让 GPT-3.5-turbo 更好地理解新闻内容,我们会把之前提取的新闻标题和正文信息一起 “告诉” 它。最后,用 “LLM Prompter” 节点让 GPT-3.5-turbo 开始工作,它就会帮我们把每篇新闻都总结成又短又全面的摘要,关键信息一个都不会少!

步骤 3:把摘要变成报告并发送 - 创建新闻评论报告并邮件发送

想要把整理好的新闻摘要变成一份好看又有条理的报告,可以用 KNIME Reporting 扩展和组件的复合视图。

在 “News Summaries” 组件里,我们可以对 GPT-3.5-turbo 给出的回复再加工一下,设计好报告的排版布局,把新闻摘要和一个吸引人的标题放在一起,这样整个报告看起来既吸引人,又清清楚楚。这里还会用到 “Report Template Creator” 节点,用它可以设置报告页面的大小和方向,就像给报告选一个漂亮的 “封面”。

要自动把报告通过邮件发出去,就得借助 KNIME 电子邮件处理扩展。它能帮我们连接到邮箱服务器,管理邮件的发送。在这个例子里,我们先做一个 “Fake Email Inbox Setup” 组件,它会生成一个测试用的 “假邮箱”,里面装满虚构的邮件,用来模拟真实的发送场景。

接着,用 “Email Connector(Labs)” 节点连接到你常用的邮箱,不过要记得输入正确的身份验证信息,这样才能安全地访问邮箱,还要设置好收信和发信的相关参数。

最后,“Email Sender(Labs)” 节点就会把报告发送给你指定的收件人。你还能给邮件加一个吸引人的主题,把邮件内容设置成好看的富文本格式。而且,生成的报告不用你手动添加,它会自动作为附件发出去,是不是很方便?

三、最终成果与个性化设置

通过上面的步骤,每天早上你就能收到一份整理好的世界新闻摘要报告啦!这份报告清楚又有条理,每个媒体的新闻都分开展示,能看到新闻标题、发布的日期和时间、简洁的摘要,还有文章的完整链接,要是你想了解更多细节,点一下链接就能看原文。

要是你还想让报告里的新闻看起来更醒目,比如给文章加个黑框,也很简单!只要找到组件的 “高级复合视图布局” 选项卡,在 “content” 元素那里添加一些 CSS 样式命令就行啦。

KNIME 的工作流程自动化功能,可以通过 KNIME 社区中心的 KNIME 工作流助手来实现。你还能设置工作流程在特定的时间运行,比如每天早上 8 点,这样每天早上喝咖啡的时候,就能轻松了解全球大事啦!

四、回顾与总结

通过这篇教程,你学会了怎么从不同的新闻媒体抓取和解析新闻文章,怎么用KNIME的AI 扩展功能总结新闻,还学会了把摘要做成报告,再通过邮件发出去。现在就动手试试吧,让新闻获取变得轻松又高效!

来源:卓越方达科技

相关推荐