张量

万亿并发级别!大模型主流运行框架技术和生产级配置最佳实践!

在当今数字化时代,大模型已成为推动人工智能发展的核心力量。从自然语言处理到计算机视觉,从智能客服到智能驾驶,大模型的应用无处不在。然而,随着模型规模和复杂度的不断增加,如何实现万亿并发级别的高效运行,成为了业界面临的重大挑战。本文将深入探讨大模型主流运行框架技

模型 张量 配置 推荐系统 parallelism 2025-06-28 20:24  2

首发 | 记忆张量获近亿元天使轮投资,专注于基本原理驱动的系统性创新

记忆张量(上海)科技有限公司(以下简称“记忆张量”)近日宣布完成近亿元天使轮融资,本轮融资由孚腾资本、算丰信息、中金资本等知名机构共同投资,云岫资本担任独家财务顾问。成立于2024年11月的记忆张量,专注于基本原理驱动的系统性创新,以“低成本、低幻觉、高泛化”

创新 记忆 张量 天使 鄂维南 2025-06-18 08:00  4

独家|魔术背后:张量如何驱动变换器(Transformer)

变换器改变了人工智能在语言理解和数据学习等方面的工作方式,大语言模型的核心是张量(一种帮助处理信息的通用数学矩阵)。当数据通过变换器的不同部分时,张量会发生不同的变换,从而帮助模型理解句子或图像等内容。了解变换器中的张量是如何工作的,有助于理解当今最智能的人工

魔术 张量 transformer 解码器 变换器 2025-06-10 07:08  4

长程相互作用中热面积律的突破

量子多体问题是现代物理学中一项艰巨的挑战,旨在揭示大量相互作用粒子的集体行为。其核心在于量子关联和纠缠的复杂图景,这些基本特性超越了经典直觉。在这些关联中,一个最深刻的见解是“面积律”(Area Law),它深刻地塑造了我们对量子信息分布的理解以及各种计算方法

张量 热力学 中热 面积律 中热面积律 2025-05-27 12:00  5

标量曲率,一切几何内容的“语法根源”,理解“什么是弯曲”关键

设想你站在一块看不见边缘的表面上,它可能是平坦的,也可能是曲折的。在不动的前提下,你试图理解脚下这片空间的结构。你不能飞起来鸟瞰,也无法拉直它——但你可以在原地画一个圆。用一根细杆当做笔尖,从你所在的位置向四周“走出去”,始终保持相同的距离,在各个方向上勾勒出

张量 语法 几何 黎曼 标量 2025-05-25 13:25  5

开放系统如何驱动 AI 性能

当 Wang 讨论大语言模型 (LLM) 性能时,对话迅速从市场炒作转向技术热图、GPU 优化、网络瓶颈以及编译器的复杂细节。如果讲编译器故障和 TensorRT 错误日志感觉枯燥乏味,那就等着看 Wang 如何把这些日志变成笑话。

开源 张量 llama wang centml 2025-05-22 23:25  5