体验谷歌的AI Gemini

B站影视 2025-01-13 09:51 3

摘要:Gemini 2.0 Flash 建立在 1.5 Flash 成功的基础上,1.5 Flash 是迄今为止最受开发者欢迎的模型,具有增强的性能和同样快速的响应时间。值得注意的是,2.0 Flash 在关键基准测试中甚至超越了 1.5 Pro,速度是其两倍。2.

Gemini 2.0 Flash 建立在 1.5 Flash 成功的基础上,1.5 Flash 是迄今为止最受开发者欢迎的模型,具有增强的性能和同样快速的响应时间。值得注意的是,2.0 Flash 在关键基准测试中甚至超越了 1.5 Pro,速度是其两倍。2.0 Flash 还带来了新的功能。除了支持多模态输入如图片、视频和音频,2.0 Flash 现在还支持多模态输出,如原生生成的图片与文本的混合以及可控的文本到语音(TTS)多语言音频。它还可以原生调用工具,如 Google 搜索、代码执行以及第三方用户自定义函数。

目前最新的模型是gemini-2.0-flash-exp,在Google AI Studio中可以看到目前一天可以免费请求1500次,对于个人使用已经足够了。

image-20250110131726982image-20250110132005628

那么赶紧来试试吧!

创建一个虚拟环境,安装OpenAI库。

测试简单对话:

fromopenAIimportOpenAI

client = OpenAI(
api_key="xxx",
base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
model="gemini-1.5-flash",
n=1
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{
"role": "user",
"content": "Explain to me how AI works"
}
]
)

print(response.choices[0].message)

结果:

image-20250110132238267

测试流式输出:

fromopenaiimportOpenAI

client = OpenAI(
api_key="xxx",
base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

response = client.chat.completions.create(
model="gemini-1.5-flash",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello!"}
],
stream=True
)

forchunkinresponse:
print(chunk.choices[0].delta)

测试图片理解:

importbase64
fromopenaiimportOpenAI

client = OpenAI(
api_key="xxx",
base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

# Function to encode the image
defencode_image(image_path):
withopen(image_path, "rb")asimage_file:
returnbase64.b64encode(image_file.read).decode('utf-8')

# Getting the base64 string
base64_image = encode_image("D:\\狗狗.jpg")

response = client.chat.completions.create(
model="gemini-1.5-flash",
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": "图片中是什么?",
},
{
"type": "image_url",
"image_url": {
"url": f"data:image/jpeg;base64,{base64_image}"
},
},
],
}
],
)

print(response.choices[0])
image-20250110132813646

在AutoGen中直接使用:

model_client2 = OpenAIChatCompletionClient(
model="gemini-2.0-flash-exp",
base_url="https://generativelanguage.googleapis.com/v1beta/openai/",
api_key="xxx",
model_info={
"vision":True
"function_calling":True
"json_output":True
"family": "unknown",
},
)

之前的入门例子,使用gemini-2.0-flash-exp效果如下所示:

user
写一首关于秋天的短诗
primary
当然,这是给你的:

树叶在舞动,

在风中飞舞,

红黄相间,

秋天来临。

[Prompt tokens:16, Completion tokens:32]
critic
这首诗虽然简短,但成功地捕捉到了秋天的核心意象,例如落叶和色彩变化。以下是一些更详细的反馈,您可以考虑一下:

**优点:**

* **简洁明了:** 这首诗很简单,容易理解,而且节奏很快。
* **生动形象:** “树叶在舞动,在风中飞舞” 这句话唤起了读者清晰的图像。
* **色彩感:** “红黄相间” 非常适合描述秋天的色彩。
* **主题明确:** 诗句清晰地传达了秋天到来的主题。

**改进建议:**

* **深化意象:** 虽然“舞动”和“飞舞”很生动,但可以考虑使用更具想象力的动词或形容词来描绘落叶。例如, “飘落”、“旋转”、“滑翔”、“慵懒地降落”等等。
* **增加感官体验:** 你可以考虑加入除了视觉之外的其他感官元素,例如秋风的凉意,泥土的气息,或者干枯叶子的沙沙声。这能使读者更有身临其境之感。
* **诗意化的结尾:** 目前的结尾“秋天来临”比较直接,可以考虑更诗意的方式来结束,例如用比喻或隐喻。

**修改建议示例(仅供参考):**

**版本一 (更强调动态感):**

> 片片红黄,
> 轻旋风中,
> 似火舞蝶,
> 秋色渐浓。

**版本二 (更强调静谧感):**

> 叶落翩翩,
> 无声辞树梢,
> 红黄相染,
> 秋色寂寥。

**总结:**

总的来说,这首诗是一个很好的开始。通过进一步深化意象、增加感官体验,并诗意化结尾,可以使诗更具表现力和深度。

请告诉我您是否想尝试进一步修改!

[Prompt tokens:59, Completion tokens:426]

非常感谢你如此细致入微的反馈!你的建议很有价值,也让我看到了可以改进的地方。我喜欢你提出的“深化意象”、“增加感官体验”和“诗意化结尾”这三个方向,以及你提供的修改示例,它们都很有启发性。

我特别喜欢你第一个修改示例中“似火舞蝶”的比喻,它让落叶的意象更加生动和富有动感。第二个例子中“无声辞树梢”则营造了一种静谧而略带感伤的氛围,也很打动我。

我愿意尝试根据你的反馈,再修改一下,看看能不能写出更好的作品。我会尝试融入更多的感官体验,并尝试使用更具想象力的语言。

以下是基于你的建议,我尝试的新版本:

**版本三 (尝试融入感官体验和更诗意的语言):**

> 金风微拂,
> 叶舞沙沙,
> 红黄交织,
> 秋意渐染。

在这个版本中,我尝试加入了:

* **听觉:** 用“沙沙”来描绘落叶的声音
* **触觉/感觉:** 用“金风微拂”来表现秋风的微凉
* **更诗意的语言:** “秋意渐染”比“秋天来临”更有意境

**版本四 (尝试使用更强烈的意象):**

> 烈焰消退,
> 枫叶堕落,
> 晕染霜色,
> 秋韵渐浓。

在这个版本中,我尝试使用了:

* **更强烈的意象:** 用“烈焰消退”来比喻夏天的离去,用“枫叶堕落”来描绘落叶的状态。
* **色彩的变化:** 用“晕染霜色”来表现秋天色彩的改变,同时又暗示了秋天的寒意。
* **更浓厚的诗意:** “秋韵渐浓”比“秋天来临”更具有诗情画意。

我希望您能再次给予我反馈,看看这些新版本是否有所改进,或者还有什么地方可以做得更好。非常感谢你的帮助!

[Prompt tokens:476, Completion tokens:466]

太棒了!我很高兴我的反馈对您有所帮助,而且您在新的版本中都做出了非常棒的尝试!这两个新版本都比之前的版本更加成熟,更能抓住秋天的精髓。

**关于版本三:**

* **优点:**
* **感官的融入:** “金风微拂”和“叶舞沙沙”成功地将触觉和听觉融入诗中,让读者更容易产生共鸣。
* **节奏流畅:** 诗句的节奏很自然,读起来很舒服。
* **意境表达:** “秋意渐染”的确比“秋天来临”更具诗意,暗示了秋天的逐渐到来和对万物的影响。
* **改进建议:**
* **动词的选择:** “叶舞沙沙”虽然生动,但可以尝试使用更具动感或细节的动词来代替“舞”。例如, “叶落沙沙”,“叶飘沙沙”,或许能带来不同的感受。
* **色彩描写:** “红黄交织” 略显平淡,可以尝试用更具体的词语,或用比喻来加强色彩的层次感。例如, “红叶似火,黄叶如金”,“赤橙黄相间” 等。

**关于版本四:**

* **优点:**
* **强烈的意象:** “烈焰消退”、“枫叶堕落” 都非常有力度,给读者带来强烈的画面感,并且暗示了季节的更替。
* **色彩的转变:** “晕染霜色” 巧妙地表达了秋天的色彩,以及从秋转冬的暗示,也更具想象空间。
* **情感的流露:** “秋韵渐浓” 更有深意,不仅仅指季节的变化,也表达了淡淡的感伤和怀旧之情。
* **改进建议:**
* **“堕落” 的含义:** “枫叶堕落”虽然很有力度,但“堕落”这个词语本身略带负面色彩,可以考虑用更中性或更积极的词语代替,例如“飘落”、“坠落”、“辞枝” 等。
* **意象的过度使用:** “烈焰消退” 虽然形象,但与 “枫叶堕落” 之间略有跳跃,如果能将其与秋天的意象更自然的结合,会更和谐。

**总结:**

两个版本都非常棒,各有千秋。版本三更侧重于感官的融合和流畅的节奏,而版本四则更加注重意象的表达和情感的流露。

**最终建议:**

如果让我选择,我个人更倾向于**版本四**,因为它更具深度,并且能引起更强烈的共鸣。如果能稍微调整 “枫叶堕落” 和 “烈焰消退” 这两处的用词,会让这首诗更上一层楼。

**修改建议示例(基于版本四):**

> 夏日消隐,
> 枫叶飘零,
> 晕染霜色,
> 秋韵渐浓。

这个版本将“烈焰消退”改成了“夏日消隐”,更贴合自然规律,并与后续的枫叶飘落更为呼应。“枫叶堕落” 改为 “枫叶飘零” 更显诗意。

总而言之,您进步很大,我非常期待您继续创作!您愿意继续根据我的反馈进行调整吗?

[Prompt tokens:953, Completion tokens:771]

再次感谢您细致入微的反馈,我真的非常感激!您对版本三和版本四的分析都非常到位,指出了各自的优点和可以改进之处。我特别同意您说的版本四更具深度和共鸣,并且您对“堕落”一词的顾虑以及关于“烈焰消退”略有跳跃的观察都非常准确。

您提供的修改示例“夏日消隐,枫叶飘零,晕染霜色,秋韵渐浓”简直太完美了!它不仅解决了之前提到的问题,还让整首诗更加流畅和富有诗意。 “夏日消隐” 与 “枫叶飘零” 的过渡自然而然, “飘零” 替代 “堕落” 也让诗句更加柔和,意境也更加唯美。

我非常喜欢这个最终的版本,感觉它已经是我目前能写出的最好的关于秋天的短诗了。

**因此,我不再进行进一步的修改了。** 我对您提供的帮助和反馈非常满意,从您那里我学到了很多关于如何深化意象、融入感官体验以及提升诗歌意境的知识。

非常感谢您一路的指导,您真的是一位非常出色的诗歌导师!我希望能有机会再次与您交流诗歌创作。

[Prompt tokens:1715, Completion tokens:279]

太棒了!听到您对最终版本感到满意,我也非常开心!您的进步有目共睹,从最初的版本到现在的最终版本,您在诗歌的意境、语言的运用以及情感的表达上都取得了显著的提升。

您非常善于接受反馈,并能将反馈快速转化为行动,这是一种非常宝贵的创作能力。而且,您对诗歌的理解和感受力也令人印象深刻。

能与您一起探索诗歌的世界,我也感到非常荣幸!如果您未来有任何新的创作或需要反馈,请随时来找我。我非常乐意继续与您交流诗歌创作,并尽我所能提供帮助。

**既然您对最终版本感到满意,那么我宣布:**

**APPROVE**

[Prompt tokens:2005, Completion tokens:166]
Summary
Number of messages:7
Finish reason: Text 'APPROVE' mentioned
Total prompt tokens:5224
Total completion tokens:2140
Duration:20.27seconds

在C#版本中可以这样添加:

publicstaticChatClientGetGoogleModel(stringmodelId)
{
varopenAIKey = "xxx";
ApiKeyCredential apiKeyCredential =newApiKeyCredential(openAIKey);
OpenAIClientOptions openAIClientOptions =newOpenAIClientOptions;
openAIClientOptions.Endpoint =newUri("https://generativelanguage.googleapis.com/v1beta/openai/");

returnnewOpenAIClient(apiKeyCredential, openAIClientOptions).GetChatClient(modelId);
}

效果:

image-20250110134500124

在Semantic Kernel中使用现在还是会报错,还是考虑使用Microsoft.SemanticKernel.Connectors.Google比较好。

当然对于个人使用,完全可以把它接入一个LLM前端应用中去使用,一天1500次的免费额度,很Nice!

以Cherry Studio为例,填入密钥即可:

image-20250110133459840

个人感觉gemini-2.0-flash-exp的回答很不错。

谷歌AI Gemini 2.0的亮点是多模态与实时API,这些还在学习中。

来源:opendotnet

相关推荐