|
编纂 | 苏建勋 杨轩
又一位互联網技能大拿投身于AI赛道。
36氪從多個自力信源处得悉,快手前MMU(Multimedia understanding,多媒體内容理解)賣力人李岩在2022年下半年建立了AI公司“元石科技”咳嗽怎麼辦,,重要举行多模態大模子的研發。36氪就上述信息向元石科技求證,获得了必定的复兴。
结業于中國科學院计较技能钻研所的李岩,是工号在75上下的快手老員工,也是快手AI技能研發的焦點人物。2015年11月,在時任快手CEO的宿华的支撑戰績網,下,李岩组建了内部第一個深度進修部分DL(Deep Learning)组,方针是構建算法模子對违法违規的视频内容举行辨認。
跟着AI技能的堆集,快手對视频内容理解發生了更多的需求。2016年,李岩将團队的名字從DL组改成MMU(Multimedia understanding,多媒體内容理解)组,在解决平安合規問题以外,浏览语音、文字、圖象等多種情势的算法模子研發。
几名知恋人士暗示,李岩于2021在快手提出离任,并于2022年下半年建立了元石科技。這一次自力創業,李岩也找到了最為合用于内容理解的技能路径——多模態大模子。
所谓的多模態模子,指的基于文本、圖象、视频、音频等多種模態数据举行進修练習的人工智能算法。简略而言,多模態模子就是一所AI综合院校,如色情網站,baidu行将公布的“文心一言”,就是基于多模態大模子“文心”练習而成的说话单模態模子。
早在2018年,李岩就在公然場所夸大了多模態技能的首要性。在CNCC2018“高通量媒體内容理解論壇”上,李岩提到多模態内容理解對快手如许一家内容公司的计谋意义:
“视频是视觉、听觉、文本多種模態综合的信息情势,而用户的举勸也是此外一種模態的数据,以是视频自己就是一個多模態的問题,再加之用户举勸就更是一種加倍繁杂的多模態問题。以是多模態的钻研對付快手来讲,是很是首要的课题。”
今朝,海内企業的AI模子层竞人體感應燈,滅蚊燈,争逐步進入了白热化的阶段。前有baidu、字节跳勸等互联網大厂群雄逐鹿,後有創企操纵各自的場景和数据上風竞相發力。
本年3月初,模子层企業又迎来两位壮大的竞争者。3月2日,OpenAI以1000 tokens/$0.002(约即是100万個单词/18元)的“白菜價”公布了ChatGPT API。一天後,大股东微軟在雲计较平台Azure的全世界版中正式上線了Azure OpenAI辦事,支撑企業级客户基于OpenAI的天生式AI模子举行場景立异和利用落地。
這對付建立于風口的元石科技而言,定是一場查驗AI技能和行業沉淀的硬战。 |
|