阿里平头哥首颗自研芯片已和业务方做适配
2022-10-07 11:48:31 来源:
(原标题:阿里平头哥首颗自研芯片已和业务方做适配,“希望年底落地”)
澎湃新闻记者 承天蒙
9月25日云栖大会上,阿里巴巴第一颗自研芯片,“全球最高性能AI推理芯片”含光800发布。
阿里巴巴平头哥半导体公司研究员、含光800芯片负责人骄旸表示,现在芯片已经在和业务方去做适配了,“希望年底左右可以落地”。他还表示,由于目标定得很高,“我们团队做出了非常非常大的牺牲。”
含光800的研发速度令人瞩目。据平头哥介绍,平头哥NPU团队用最短的时间完成了芯片的设计、流片整个过程,7个月完成前端设计,之后仅了3个月就成功流片。骄旸表示,流片仅一次就获得了成功。
在一场媒体群访中,骄旸对记者介绍,“这个NPU我们团队花了差不多一年的时间,从团队组建,到设计完成、架构验证,到我们流片回来,是一次成功。流片回来后就通过了验证。”
芯片设计是一个复杂的系统工程,单纯完成设计并不意味着就可以流片成功,这是行业的深水区,假如流片失败,就意味着硬件设计需要推倒重来,这比软件出BUG更加严重。
一般芯片公司需要做两次工程样品、产品样品或多次样品才能流片成功。而流片成功后也不代表就可以直接商用,它还需要经过复杂的测试验证,在各项指标都符合实际场景需求后才到了真正的商用阶段。
针对澎湃新闻记者的询问,骄旸表示,其实这种速度下,保证质量是“非常难的”,他补充道,“我们团队做出了非常非常大的牺牲,好在团队的工作经验是比较丰富的。”
骄旸还提到,“由于定下了一个比较高的目标,我们甚至有的团队成员第一天加入,当天晚上就去debug(排除程序故障)了。”
据平头哥介绍,含光800主要用于云端视觉处理场景,目前已开始应用在阿里巴巴内部核心业务中。
根据云栖大会的现场演示,1个含光800的算力等于10个GPU。以城市大脑中实时处理杭州主城区交通视频为例,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
有网络说法称,含光800芯片第一次流片时,一群工程师忐忑地在电梯口等结果,当得知流片成功时,有工程师哭了出来。
骄旸介绍,为什么要立下这种时间紧、任务重的目标,除了背后有计算支撑之外,这与为什么平头哥要做AI芯片的战略也有关系。
骄旸说,AI芯片是一个新的领域,有发展的机会。老的计算平台如CPU、GPU等,是为老的计算形态设计的。GPU原本是用于视频渲染,在AI计算没有更好的替代方案时,位于临界点上的GPU便成为了选择。而一旦有更好的选择,GPU很快就会被替代。速度便十分重要。
“我们看到了人工智能算法需要一个特殊的架构,”骄旸表示,“虽然挑战很大,但从阿里巴巴的要求来说,我们是一定要去挑战那个‘皇冠上的明珠’。”
“含光800已经量产,只服务阿里内部,暂不打算向第三方企业独立销售。”阿里巴巴研究员、平头哥半导体有限公司IoT芯片研究员孟建熠告诉澎湃新闻记者,“量产数量暂不方便对外透露。”
宏杉科技发布“万象”分布式存储共话海量存储新未来
(原标题:宏杉科技发布万象分布式存储 共话海量存储新未来) 9月21日下午,由宏杉科技主办的数聚万象 澎湃未来分布式存储研讨会暨
2022-10-07 08:39
京东超市:三年内商超领域第一打造零售生态体系
网易科技讯 8月31日消息,京东超市今日宣布,将持续不断加大对品牌、消费者、进口商品和供应链的投入,力争在不到三年的时间成为含线上、
2022-10-06 21:07
印度两大顶级港口正寻求让特斯拉在当地建厂
财联社1月20日讯,据报道,印度两大顶级港口坎德拉和蒙德拉正寻求让特斯拉在当地建立工厂。业内人士透露,古吉拉特邦已经建立了汽车和
2022-10-06 05:19
知否指纹藏着啥秘密?看指纹就知道你是个爱抽烟的胖子
作者 小贤 出品 网易科技《知否》栏目组(公众号:tech_163) 指纹之所以存在,是为了给人的手掌和脚掌提供粗糙表面,让人更容易
2022-10-05 18:32
又一家起名鬼才!B站关联公司申请“呵呵呵”商标
(原标题:B站关联公司申请呵呵呵商标 此前曾成立上海呵呵呵文化传播有限公司) 天眼查App显示,近日,上海幻电信息科技有限公司新增
2022-10-05 15:11