Ollama 已经支持千问 QwQ-32B-Preview:数学和编码方面非常出色!

B站影视 2024-11-28 15:29 6

摘要:QwQ-32B-Preview 是 Qwen 团队开发的一个实验性研究模型,主要用于提高人工智能推理能力。作为一个预览版,它在展示了良好的分析能力的同时,也存在一些重要的局限性:

QwQ-32B-Preview 是 Qwen 团队开发的一个实验性研究模型,主要用于提高人工智能推理能力。作为一个预览版,它在展示了良好的分析能力的同时,也存在一些重要的局限性:

语言混合和代码切换:模型可能会意外地混合语言或在语言之间切换,从而影响响应的清晰度。递归推理循环:该模型可能会进入循环推理模式,导致冗长的回答而没有一个结论性的答案。安全和道德考虑因素:该模型需要加强安全措施以确保性能可靠和安全,用户在部署时应谨慎。性能和基准限制:该模型在数学和编码方面表现出色,但在常识推理和细微语言理解等其他方面仍有改进空间。

Ollama-OCR 只需几行代码,轻松实现高质量文字识别!

QwQ 在这些基准测试中表现出色:

在 GPQA 上达到了 65.2%,展现了其研究生级别的科学推理能力;在 AIME 上达到了 50.0%,突显了其强大的数学问题解决技能;在 MATH-500 上达到了 90.6%,证明了其在多样化主题中出色的数学理解能力;在 LiveCodeBench 上达到了 50.0%,验证了其在现实世界场景中强大的编程能力。

这些结果强调了 QwQ 在分析和问题解决能力上的显著进步,特别是在需要深度推理的技术领域。

Ollama 提供了不同版本的 QwQ,在安装时,可根据您设备当前的内存和硬盘空间来选择安装的版本。

使用以下命令,将默认安装量化后的版本:

(base) ➜ ~ ollama run qwqpulling manifestpulling 630f278a7c73... 100% ▕██████████████████████████████████████▏ 19 GBpulling 50795fcf7f4d... 100% ▕██████████████████████████████████████▏ 107 Bpulling 41190096a061... 100% ▕██████████████████████████████████████▏ 1.2 KBpulling b87250e4478f... 100% ▕██████████████████████████████████████▏ 11 KBpulling 38be9dd7999c... 100% ▕██████████████████████████████████████▏ 488 Bverifying sha256 digestwriting manifest

模型比较大,经过漫长的等待,终于下载完了。下面 kakuqo 来实际测试一下 QwQ。

简单问答

>>> 你是谁啊我是来自阿里云的大规模语言模型,我叫通义千问。我可以回答各种问题、提供信息和与用户进行对话。如果你有任何疑问或需要帮助,请随时告诉我!>>> 你擅长什么作为一个大规模语言模型,我擅长处理大量的文本数据,并能够理解和生成自然语言。我的主要功能包括:1. **回答问题**:我可以回答各种主题的问题,如科学、历史、文化、技术等。2. **提供信息**:我可以提供关于特定话题的详细信息和背景知识。3. **创作内容**:我可以帮助用户创作文章、故事、脚本等文本内容。4. **语言翻译**:虽然我的主要功能是处理中文,但我也可以进行基本的英汉互译。5. **对话交流**:我可以与用户进行自然的对话,提供互动式的体验。6. **创意构思**:我可以帮助用户 brainstorming,提出新的想法和概念。7. **教育辅导**:我可以为学生提供学习上的支持和指导。8. **情感陪伴**:在我能力范围内,我可以倾听用户的感受,并提供一些安慰和建议。请告诉我你需要什么帮助,我会尽力 assists 你!>>> 你跟 OpenAI 的 o1-preview 和 o1-mini 相比,能力怎么样作为一个语言模型,我和OpenAI的GPT-3或其他版本(如O1-Preview和O1-Mini)都是基于不同的训练数据和技术架构。每个模型都有其独特的优势和特点。在我所知的范围内,通义千问是阿里云自主研发的预训练语言模型,它在中国的语言环境中进行了大量的训练,并且针对中文场景进行了优化。因此,在处理中文相关的问题时,我可能具有更好的理解和表达能力。而OpenAI的GPT-3及其衍生版本在全球范围内都有广泛的应用,它们在英语和其他国际语言上的表现也非常出色。这些模型经过大规模的数据训练,能够处理多种语言和主题。总的来说,不同的语言模型各有千秋,选择哪个模型取决于具体的使用场景和需求。如果你有具体的问题或任务,可以告诉我,我会尽力提供帮助。

Question:

有两个瓶子,一个装有 3 升水,另一个装有 5 升水,问如何只用这两个瓶子得到 4 升水?

Answer:

有两个瓶子,一个能装3升水,另一个能装5升水。问题是怎么样利用这两个瓶子量出 exactly 4升水来。听起来挺有意思的,我得想想办法。首先,我需要明确一下这两个瓶子的容量是固定的,一个是3升,一个是5升,而且假设它们都是空的开始。我的目标是得到正好4升水。因为只有两个瓶子,我可能需要通过倒来倒去的方式,利用它们的容量差来测量出4升水。让我先考虑一下5升的瓶子。如果我把它装满,里面有5升水。然后我想办法从里面去掉1升,因为5减1等于4。但是我没有1升的量具,所以这个方法不行。或者,我可以尝试用3升的瓶子来帮助测量。比如,我把5升的瓶子装满,然后用它往3升的瓶子里倒水,直到3升瓶满了。这样的话,5升瓶里就剩下了2升水(因为5减3等于2)。然后,我把3升瓶里的水倒掉,变得空的。再把那2升水从5升瓶倒入3升瓶,现在3升瓶里面有2升水。接下来,我把5升瓶装满,然后再往3升瓶里倒水。3升瓶原来有2升,还能再装1升。所以从5升瓶倒1升到3升瓶,使3升瓶满了。这时,5升瓶里面就剩下了4升水(因为5减1等于4)。哦,看来这样可以得到4升水。让我再验证一下步骤:1. 把5升瓶装满。2. 从5升瓶往3升瓶倒水,直到3升瓶满,这时5升瓶里剩下2升水。3. 把3升瓶里的水倒掉,变空。4. 把5升瓶里的2升水倒入3升瓶,现在3升瓶有2升水。5. 把5升瓶装满。6. 从5升瓶往3升瓶倒水,直到3升瓶满。因为3升瓶原来有2升,所以只能再加1升。因此,从5升瓶倒1升到3升瓶,使3升瓶满。7. 现在,5升瓶里剩下4升水。看起来这个方法是可行的。但是,我再想想有没有更简单的办法。另一个想法是利用3升瓶和5升瓶的组合来得到4升。比如,我可以把3升瓶装满,倒入5升瓶,然后再次装满3升瓶,继续倒入5升瓶,看看会发生什么。开始:1. 把3升瓶装满,倒入5升瓶,5升瓶现在有3升水。2. 再次把3升瓶装满,再往5升瓶倒水。5升瓶原来有3升,还能加2升就满了。所以从3升瓶倒2升到5升瓶,使5升瓶满。3. 这时,3升瓶里还剩1升水(因为已经倒了2升到5升瓶,原来有3升)。4. 把5升瓶里的水全部倒掉,变空。5. 把剩下的1升水从3升瓶倒入5升瓶,现在5升瓶有1升水。6. 把3升瓶装满,倒入5升瓶。5升瓶原来有1升,还能加4升。但是3升瓶只有3升,所以全部倒进去,5升瓶有4升水(1+3=4)。嗯,这个方法也得到了4升水。步骤是:1. 3升瓶装满,倒入5升瓶,5升瓶有3升。2. 3升瓶再装满,往5升瓶倒2升,5升瓶满(3+2=5),3升瓶里剩1升。3. 把5升瓶倒空。4. 把3升瓶里的1升倒入5升瓶。5. 把3升瓶装满,倒入5升瓶,5升瓶有1升,加上3升,总共4升。这两个方法都可以得到4升水,只不过步骤稍有不同。第一个方法是通过在5升瓶中留下4升水,第二个方法是通过5升瓶中含有4升水。本质上是一样的。也许还有其他的方法,但我现在想到的就这些。总之,这个问题可以通过来回倒水,利用两个瓶子的容量差来测量出所需要的4升水。

Question:

使用小学生听得懂的方式来分析这个问题:小明从第一阶台阶向上走,如果每一步上2阶,则最后一步剩1阶;如果每一步上3阶,则最后一步剩2阶。问台阶总数是多少?

Answer:

好的,让我们来解决一个关于台阶的问题。想象一下,小明在爬楼梯,这个楼梯有若干个台阶。小明尝试以不同的步数来爬这些台阶,结果发现了一些有趣的事情。首先,当小明每次走2阶台阶时,最后会剩下1阶没走。也就是说,如果他一直两次走2阶,最后还会有一阶没有走到。换句话说,总台阶数除以2,会得到一个商和余数1。其次,当小明每次走3阶台阶时,最后会剩下2阶没走。类似地,总台阶数除以3,会得到一个商和余数2。我们的任务是找出这个楼梯一共有多少阶台阶,满足上面这两个条件。为了更好地理解,让我们试着列出一些可能的台阶数。首先,考虑每次走2阶剩1阶。那么台阶数可能是:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 等等。这些都是奇数,因为除以2总是余1。接下来,考虑每次走3阶剩2阶。那么台阶数可能是:2, 5, 8, 11, 14, 17, 20, 23, 等等。这些数字除以3都余2。现在,我们要找一个数字,它同时出现在这两个列表中,也就是说,它是既满足除以2余1,又满足除以3余2的数。让我们来看看这两个序列:- 除以2余1的数:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, ...- 除以3余2的数:2, 5, 8, 11, 14, 17, 20, 23, ...现在,找出它们共同的数字。看看哪个数同时出现在两个列表中。 looking at the lists:- 1 (only in first list)- 2 (only in second list)- 3 (only in first list)- 5 (in both)- 7 (only in first list)- 8 (only in second list)- 9 (only in first list)- 11 (in both)- 13 (only in first list)- 14 (only in second list)- 15 (only in first list)- 17 (in both)- and so on...所以,共同的数有5, 11, 17, 23, etc.这意味着,台阶的总数可以是5阶、11阶、17阶、23阶,等等。你可能注意到,这些数字之间相差6。这是因为6是2和3的最小公倍数。所以,一旦找到一个解,比如5,那么再加上6的倍数,都会是其他的解。所以,通用的公式是:台阶数 = 5 + 6n,其中n是非负整数(0,1,2,3,...)例如:- 当n=0时,台阶数=5- n=1时,台阶数=11- n=2时,台阶数=17- n=3时,台阶数=23- 等等。所以,答案是台阶的总数是5加6的倍数,也就是5, 11, 17, 23, 等等。**Final Answer**\[ \boxed{5 + 6n \text{ for non-negative integer } n} \]

测试过程中,发现会存在中英文混合输出的情况。后面打算重点试试小学的数学题的解题能力,好用的话,可以给我家小孩用上。如果你有其他问题想问 QwQ,可以在评论区留言哈。

本文,完。觉得本篇文章不错的,记得随手点个赞、收藏和转发三连,感谢感谢~如果想第一时间收到推送,请记得关注我们⭐~

来源:AIGC研究社一点号

相关推荐