来源:互联网 更新时间:2026-06-22 17:59
在刚刚落幕的WWDC2026上,LM Studio与苹果联手搞了个大动作——仅用四台Mac Studio组成的集群,就成功跑起了月之暗面的万亿参数大模型Kimi K2.6。这一成果直接打破了“万亿模型只能靠云端GPU集群”的固有认知,让消费级硬件承载前沿AI算力从概念变成了实实在在的工程现实。
Kimi K2.6总参数规模高达1万亿,采用MoE架构,激活参数320亿,支持长上下文、多模态输入以及智能体任务处理。演示中,四台Mac Studio通过苹果的内存共享和互联技术组成集群,统一内存总量约1.5TB,刚好满足这一巨型模型的推理需求。此前开发者测试显示,在类似配置下Kimi K2.6可达到约28 tokens/s的生成速度,而功耗远低于传统GPU方案。要知道,这个速度对于本地推理来说已经相当可观了。
更值得关注的是,演示中还展示了LM Studio的LM Link远程访问功能。用户可以在MacBook Neo笔记本和iPhone上安全地远程连接到Mac Studio集群,与正在运行的模型实时交互,而所有数据和通信始终保持本地化处理,不走云端。这意味着什么?你坐在咖啡厅里,用一部手机就能操控办公室里的集群级AI算力,而且数据全程不上云,隐私风险大幅降低。
LM Link已更新至LM Studio的Mac应用和Locally AI的iOS应用中,支持端到端加密连接。这一设计让用户即使手握轻量设备,也能随时调用集群级的AI算力,同时不必担心隐私泄露问题。配合苹果Thunderbolt 5 RDMA等多设备内存共享技术,整个生态在AI本地化部署方面的技术闭环正在加速成型。可以说,苹果的硬件互联能力正在为本地AI推理铺出一条新路。
这次合作释放了一个清晰信号:本地部署万亿参数大模型不再是遥不可及的实验室概念,而是正在走向开发者案头的工程现实。随着苹果硬件互联能力的持续进化,消费级设备承载大规模AI推理的边界,有望被进一步拓宽。接下来的故事,值得持续关注。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
如何在夸克浏览器中开启网页视频的倍速播放功能?
蒙古上单是什么梗
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
作家助手如何上传自制封面 作家助手如何设置小说的封面
韦一敏是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
archiveofourown 实战指南:常见用法整理
有寓意的易经网名男生(精选100个)
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
抖音最火沙雕男生网名(精选100个)
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
小众游戏抖音网名男生(精选100个)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc