首页 > 智慧生活 > 智慧生活 > 国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱

发布时间:2026-01-14 16:59:19来源: 15899207736

1月14日报道,今天,首个在国产芯片上完成全程训练的SOTA(最佳水平)多模态模型开源。

这是智谱联合华为开源的图像生成模型GLM-Image从数据到训练的全流程,该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

截至今日午间休市,智谱股价涨16.83%

在聚焦文字渲染的CVTG-2K、LongText-Bench榜单上,GLM-Image的得分超越了以谷歌Nano Banana Pro为代表的认知型生成模型。

▲GLM-Image在文字渲染的CVTG-2K、LongText-Bench榜单中达到开源SOTA水平

GLM-Image实现了图像生成与语言模型的联合,核心亮点如下:

1、架构革新,面向「认知型生成」的技术探索:采用创新的「自回归 + 扩散编码器」混合架构,兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题。

2、首个在国产芯片完成全程训练的SOTA模型:模型自回归结构基座基于昇腾Atlas 800T A2设备与昇思MindSpore AI框架,验证了在国产全栈算力底座上训练前沿模型的可行性。

3、文字渲染开源SOTA:在CVTG-2K(复杂视觉文本生成)和LongText-Bench(长文本渲染)榜单获得开源第一,尤其擅长汉字生成任务。

4、高性价比与速度优化:API调用模式下,生成一张图片仅需0.1元,速度优化版本即将更新。

智东西第一时间对GLM-Image进行了体验,发现模型在汉字生成上准确度很高,优于谷歌Nano Banana Pro以及多款头部国内模型;能够较准确理解深层语义和知识概念,并将其转化为正确的视觉元素;能够在保证全局构图的同时较精准刻画局部细节

同时,GLM-Image也存在字体风格呈现不准、生成需要等待时间、一些科学概念理解不足等问题;且相比于一些免费选择,其仍需要收取少量费用。

智慧生活更多>>

联想预热ThinkBook 14+ 2026锐龙版笔记本:至高87W,LPCAMM2 Jabra捷波朗推出Evolve3办公娱乐两用耳机,可选贴耳或包耳款 好玩!Q4小米与荣耀并列,全年小米与OPPO并列 REDMI Pad 2 Pro官宣搭载12000mAh电池:69天超长待机 消息称荣耀Magic V6提档,可能是26年电池最大折叠屏手机 当经验成为可复制的资产,TRAE Skills 正在重新定义专业能力 不再依赖流量分发与价格补贴,AI或成即时零售争夺新入口 苹果AI两大爆料:iPhone喜提强力\"物理外挂\";Siri变强却与国内无缘? SOLAKAKA E9 Pro人体工学鼠标现身众筹平台,7侧键亮点足 iQOO 15销量出炉:仅次于小米17系列,网友:iQOO 15 Ultra值得等 realme真我Neo 8配置炸裂,1月22日登场! 澎湃OS再次公布进展通报:大量新机遇到问题,却只修复了一项! 曝腾讯向GitHub发函,要求下架“用户可获取自己聊天记录”的仓库 2025商业店装与展陈行业技术发展年会成功举办 四川绵竹三大千亿园区布局:循环经济、锂电崛起、白酒提质 全球首发天玑9500s!REDMI Turbo 5 Max明天官宣 荣耀Magic8 Pro Air官宣搭载安卓首个AI变焦阵列闪光灯 日活破亿的豆包,正悄然成为字节的“流量副中心” 国产Nano Banana开源!用华为AI芯片训练,1张图只要1毛钱 2025年小米销量前五机型曝光:K80夺冠 小米15第三 荣耀放话既Pro又AIr!轻薄不再脆弱?这3点决定能否真香 骁龙8Gen5+1/1.56英寸的2亿像素!iQOOZ11Turbo将卷翻千元机市场 TCL Q10M系列测评:Mini LED电视普及者,选Q10M还是Q10M Pro? 4499 元, 2026 年苹果首款新iPhone 来了! 华为、英伟达角逐AI数据平台,存储成AI竞争前沿 华为nova15全系详解:花粉可以有更好的选择 华为和北汽的\\,合作项目,享界,要造台轿车 2026年哈弗或推“新物种”:大六座猛龙PLUS成焦点 帕萨特沉稳外表下藏3处小瑕疵难扛 1份实录解锁破解所有用车难题 为什么大众普遍使用EA211发动机?他的稳定性怎么样?