谷歌率先举起互联网企业造AI芯片的大旗,发布TPU,亚马逊、微软、阿里巴巴、华为、百度等也纷纷发布各自的AI芯片,包括寒武纪、地平线机器人、燧原科技(被腾讯连投4次)、依图等AI创业公司和海康威视、大华等传统企业也在AI芯片领域布局。
谷歌TPU
和传统芯片厂商不同,互联网公司造芯有其独特的优势,他们更接近场景,能够更好的根据场景做针对性的优化。
例如,在阿里巴巴集团内部,仅淘宝就拥有视觉、NLP、搜索推荐等AI场景,平头哥发布的第一款芯片含光800就是视觉AI推理芯片,资料显示,这款芯片创造了两项纪录,推理性能达到78563IPS,能效比500IPS/W,两项指标均为AI推理芯片第一。1颗含光800的算力相当于10颗GPU。
去年6月,含光800正式实现大规模商用,在阿里云上为企业提供AI云服务,目前已应用于视频处理、搜索推荐等场景。
刚刚宣布研发芯片的字节跳动同样拥有大量的AI应用场景。
字节跳动,通过AI算法,让“内容找人”成为常态。除了推荐系统,其广告系统、评论系统,以及内容合规性审核系统,也都是AI技术在背后做支撑。
比如,使用自然语言处理等技术,对文章内容、用户评论等进行分析,进而进行内容推荐和内容审核;将计算机视觉技术用于抖音、火山、FaceU激萌等短视频App上,用来做人脸特效、背景分割、“尬舞机”、内容审核、封面选择、AI剪辑等;利用计算机视觉、语音识别、NLP等技术进行内容审核,发现不良内容、恶意营销等。
这些AI技术的研发与落地应用,都需要底层算力的支持。据悉,仅今日头条一款产品30天的训练模型,数据量就超过4PB,而正常训练一个完整的模型则需要至少一年的数据量48PB。1PB等于2的50次方个字节,在数值上大约等于1000个TB。人类功能记忆的容量预计在1.25TB,这意味着,800个人类记忆才相当于1个PB。更有体感的表述是,假设手机播放MP3的编码速度为平均每分钟1MB,而1首歌曲的平均时长为4分钟,那么1PB歌曲可以连续播放2000年。
过去几年,字节跳动接连推出今日头条、抖音等产品,不断收割流量。无论是精准推荐、精准营销、还是制定定制化的激励方案吸引用户付费/购买,都需要用到AI技术。随之而来的是,要处理的数据量也呈指数级增长。2018年,今日头条每日数据处理量超过50PB、存储数据超过1500PB、评论系统每天的评论数大概有1亿条。数据显示,2017年,字节跳动的服务器数量只有2到3万台,2018年这一数字猛增到17万台。