llm资讯_B站影视

Attention Sink产生的起点？清华&美团揭秘MoE LLM中超级专家机制

稀疏激活的混合专家模型（MoE）通过动态路由和稀疏激活机制，极大提升了大语言模型（LLM）的学习能力，展现出显著的潜力。基于这一架构，涌现出了如 DeepSeek、Qwen 等先进的 MoE LLM。

llm moe sink attention moellm 2025-08-11 16:26 3

如何将 RAG 检索召回率从 50% 提高到 95% 以上

在本文中，我会分享一些改进 RAG（检索增强生成）应用程序中检索的出色技术。最近在一个客户项目中使用了这些技术，将系统的召回率从大约 50-60% 一直提高到 95% 及以上。

聊天机器人 rag llm helsinki massage 2025-08-11 01:07 4

用AI写论文的情况，可能比想象中更普遍｜Landing AI

从一开始的语言润色和结构优化，到如今直接参与段落生成，先不说正确程度如何，如我们所见，AI正在走进更多的学术写作过程之中。最近发表在《Nature Human Behaviour》上的一项研究，首次以大规模统计方式量化了这一趋势。

论文 llm 中更医学论文 landing 2025-08-09 07:37 2

扩散LLM推理新范式：打破生成长度限制，实现动态自适应调节

随着 Gemini-Diffusion，Seed-Diffusion 等扩散大语言模型（DLLM）的发布，这一领域成为了工业界和学术界的热门方向。但是，当前 DLLM 存在着在推理时必须采用预设固定长度的限制，对于不同任务都需要专门调整才能达到最优效果。

推理范式 llm 自适应 llm推理 2025-08-08 18:57 2

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

近日，开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注，主要集中在提升量化大语言模型（LLM）的推理性能，尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率，还首次实验性支持了 Inte

推理 llm intel gpu intelgpu 2025-08-08 18:37 3

江西电信申请基于LLM大小模型协同训练专利，大大提高模型学习能力和工作效率

国家知识产权局信息显示，江西电信信息产业有限公司申请一项名为“基于LLM大小模型协同训练的方法、介质及设备”的专利，公开号CN120449937A，申请日期为2025年04月。

模型江西 llm 专利电信 2025-08-08 11:23 2

论文解读：单个标点符号如何欺骗LLM，攻破AI评判系统

可验证奖励强化学习（Reinforcement Learning with Verifiable Rewards, RLVR）是一种基于参考标准的训练范式，其核心在于通过基于规则的函数或生成式LLM评判器来提供奖励信号。在RLVR训练过程中，奖励模型接收问题q

论文 llm 标点符号数据集万能钥匙 2025-08-07 20:31 2

从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

kimi llm 架构 llama llm主流 2025-08-07 18:02 3

开发者新工作流

自 2021 年夏季 GitHub Copilot 以预览版问世以来，编程助手产品呈现爆发式增长。这类工具最初被用作增强型代码补全工具，而 Cursor、Windsurf 等产品则迅速转向了 Agent 交互模式：通过自然语言指令触发，助手能自主执行修改代码

sonnet llm agent prompt 工作流 2025-08-07 12:36 2

如何进行竞争对手流量分析(9个步骤)

当您阅读本文时，想象一下您是一个新的宠物用品品牌，正在与零售商 Hollywood Feed 展开正面交锋。

竞争 llm seo 竞争对手 hollywood 2025-08-07 11:46 3

大模型Agent：重塑企业业务流程，精准击破五大核心痛点

在数字化转型的浪潮中，企业级大模型Agent正逐步成为企业解决传统业务痛点的关键力量。通过整合认知决策与自动化执行能力，这些Agent不仅优化了业务流程，还显著提升了企业运营效率。以下是Agent如何针对五大核心痛点提供创新解决方案的详细剖析。

模型企业 llm agent 任务链 2025-08-07 12:13 2

大模型Agent，能够解决企业这些核心痛点

大模型Agent通过整合认知决策与自动化执行能力，正系统性解决企业传统业务中的核心痛点。基于行业落地案例，可将其价值归纳为以下五大类痛点及代表性解决方案：

模型企业 llm agent 任务链 2025-08-07 10:32 4

AI SSD会在2026年涌现

Sandisk UltraQLC SN670 固态硬盘提供 256 TB 和 128 TB 两种容量选择，采用 BiCS 218 层 3D NAND 技术，搭配 CBA（CMOS 直接键合阵列）2 TB 裸片设计以及 PCIe gen5 NVMe 接口。该固态

ssd llm pcie sandisk 位元组 2025-08-06 16:04 3

英伟达最新研究：小模型才是智能体的未来

首先，SLM已经足够强大，能处理AI智能体中大多数重复、专一的任务；其次，它们天生更适合智能体系统的架构，灵活且易集成；最后，从经济角度看，SLM更省钱、更高效，能大幅降低AI运行成本。

模型智能体英伟达 llm slm 2025-08-05 18:05 3

英伟达最新研究：小模型才是智能体的未来！

首先，SLM已经足够强大，能处理AI智能体中大多数重复、专一的任务；其次，它们天生更适合智能体系统的架构，灵活且易集成；最后，从经济角度看，SLM更省钱、更高效，能大幅降低AI运行成本。

模型智能体英伟达 llm slm 2025-08-05 17:09 2

第6期：血液学精准医疗的基因组学和功能技术新前沿（上）

近日，EHA 2025大会报告（EHA Perspectives Congress Reports）正式发布，分为恶性血液学和非恶性血液学两大部分。报告全面梳理了大会期间公布的重大科研成果与临床进展，为全球血液学专业人士提供了深入了解领域前沿动态的权威参考。本

医疗 et llm 血液学基因组学 2025-08-05 17:06 2

6月AI 推荐热门网站量11.3亿次，同比增长357%

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型（LLM）的发展和应用落地，聚焦LLM的市场研究和AIGC开发者生态。

网站热门 llm 雅虎日本 kayak 2025-08-05 16:29 4

谷歌推出LLM评估新范式Game Arena；ChatGPT本周冲击7亿周活里程碑丨全球科技早参

当地时间周一，谷歌在其官网表示，其联合Kaggle推出了一个全新LLM（大语言模型）评估平台——Game Arena，这个平台通过让LLM在战略游戏中直接对抗，提供一个客观、动态且可扩展的评估新范式。为庆祝平台上线，谷歌将在北美时间8月5日举行首次LLM象棋比

谷歌 llm game chatgpt arena 2025-08-05 07:56 2

将LLM集成到基于 Spring Boot的 Java 应用程序中-创建项目

大语言模型（LLM）通过实现自然语言处理（NLP）功能彻底改变了软件应用，例如聊天机器人、文本生成和智能自动化。

应用程序 llm spring boot java 2025-08-05 07:15 2

大模型时代必会技能：RAG优化15个实战技巧分享

RAG Chunking TechniquesRetrieval-Augmented Generation（RAG）很大程度上取决于你怎么分块数据。想让LLM检索到真正有意义的上下文？你得用心设计数据的分块方式。

模型 rag llm bob generation 2025-08-05 00:06 3