手机浏览器扫描二维码访问
孟繁岐的这番话,听起来让人觉得不是那么舒服。
言下之意,给人一种华国AI技术就是不如国外的感觉。
这是李彦弘不大喜欢的,毕竟他这么早就关注AI技术,就是为了研发最前沿最先进的技术。
孟繁岐大概猜到了他的想法,前世他也曾被早期华国大量发表的AI论文所迷惑。
觉得在这个新崛起的技术上,华国已经可以和美国分庭抗礼,不落下风。
虽然AlphaGO震惊了世人,但毕竟有些华而不实。
直到上千亿级别的语言大模型出现,这种纯硬核实力的比拼,让孟繁岐不得不甘拜下风。
实际上,并非是技术手段和算法层面上相差太远。
更多的还是因为优质数据的数量不足。
白度的文心一言,出图的时候甚至会将用户的中文输入翻译成英文,再去作图。
很多较真的网友故意测试了中英文差异很大的词汇,比如总线(Bus),鼠标(mouse)。
文心一言绘出的图像竟然是大巴车和老鼠,这从中文上是完全说不通的事情。
可见即便不是全部,文心一言这个所谓的专注中文的超级大模型,也在相当程度上借助了英文基础的模型权重和技术。
究竟为何要这么做,说到底还是基础不够扎实牢靠。
整理数据,清洗数据,给数据打上高质量的标签。
这些都是脏活累活,见效慢的工作。
把别人公开的数据拿过来跑一跑训一训,多么方便快捷?
以国内996大厂的内卷风气,很难容下长回报周期的基础建设。
早些时候看看不出区别,只觉得国内大厂频繁在XX榜单上露面,刷榜,又是超过这个,又是超过那个。
直到语言大模型阶段,基础语料数量和质量上的劣势才暴露无遗。
“其实这也不能完全怪华国的大厂风气,美国的互联网起步要早,并且很多领域的文献材料归档做得特别好。”孟繁岐也曾仔细思索过这方面的问题。
“像github,arxiv这样的大型公开社区,里面都是非常优质的外文代码或者论文。这些也不只是美国人自己的积累。而是通过免费公用的形式,收割了全世界的数据。”
“华国人在github上贡献的代码行数也不在少数,反过来看看华国的论文社区,就比如知网,纯纯就是毒瘤。里面屯点硕博生的论文,还要论页数收费。就连下载之后的阅读器,甚至都需要专门的....”
此消彼长之下,差了多少珍贵的数据啊...
黑天使 反派手挽手,八零抖一抖 无解 来自宇宙的情书 桂林山水甲阳朔 我不花心,只是多情 西有鹿鸣 莫名其妙爱上你 忘记 巧克力女孩 弹琴不谈情 JULIET 娱乐:让你上台卖惨,没让你笑场 冷暴力恐怖份子 华娱:导演的快乐就这么简单 夜之牙一 狂舞巔峰 荒岛求生后假千金爆火了 倾世狂妃:驯服腹黑王爷 你要不要跟我告白
被亲妹妹算计,抢走家族荣誉还不算,连青梅竹马的未婚夫也被抢走!夏小汐发誓,要报仇!伙同男闺蜜制造复仇计划,咦?结婚证上这是谁?一不留神嫁给男闺蜜的舅舅墨夜霆!墨夜霆是谁?那个富可敌国权势滔天的男人!据说还是个GAY!管他呢,先虐了渣渣再说。可是,虐完渣以后呢?离婚该提上日程了,可他对她却日日宠,夜夜宠,化身宠妻狂魔。十天有八天起不来床的夏小汐,欲哭无泪,不是说他是GAY吗?GAY你大爷!...
重生为土豪王子,第一件事做什么?先花它一个亿。性格慵懒的凌洲,重生为王子,本想快乐地享受奢侈生活的他,从第一次提取到一个‘未来片段’开始,从此一发不可收拾。从一名纨绔王子,一步步变成世界顶级神豪。书风格相对轻松一些。...
结婚三年,他第一次碰她,她以为她的爱情柳暗花明,却不料他翻脸无情,一纸离婚协议砸落在她身上,他说离婚吧,你要的我已经给你了。她错愕,顿时从天堂掉进地狱,第一次为这段无望的爱情泪眼婆娑。签下离婚协议,她凄然转身离开,带走了她的爱情,同时也带走了他的爱情...
还没结婚,蓝清沐就从天上掉下来一个儿子,婚事告吹,受尽了冷嘲热讽。北夜寒,你儿子你自己养,我养不起!北夜寒神色淡淡没事,我养你,你养儿子。儿子,过来喊妈!你儿子不是我生的,我未婚!未...
这是一部关于洪荒的小说,却是不一样的洪荒,鸿钧不是坏的,准提不是无耻的,原始也不是心胸狭窄的。洪荒也不是小说的终点。所有的内容尽量抛弃那些写烂的老套情节,力求写出新意,如果觉得好的帮忙收藏推荐吧。感谢起点论坛封面组提供封面!朋友帮忙建了个群202052728。欢迎加入交流!...
关于大神祖王缘何为虚,缘何为无?缘何为仙,缘何为神?虚无归源,仙神异路。神登绝巅,御世缔神。太极太素太始太初太易,五太驭宇百神谱上,昆仑守灵执掌乾坤探寻宇世五太,揭见神祇之妙,就在大神祖王。企鹅群292651220,验证为书名。...