FX168财经网_全球视野外汇黄金加密货币NFT资讯网

人工智能：中国式ChatGPT的“大跃进”

调查，过去五年，人工智能和互联网的招聘薪资均处于上涨态势，人工智能年均招聘薪资明显高出互联网。2022年，人工智能招聘平均年薪为33.15万元，比互联网高出4.27万元，即14.78%。五年来人工智能与互联网招聘平均年薪对比在ChatGPT爆火后，这样的情况越来越明显。据上述调查显示，与ChatGPT相关的岗位工资均超过平均水平，AIGC为39.08万，对话机器人为34.89万，预训练模型为33.93万。“ChatGPT一火起来，AI工程师的薪资水平也越来越高，你不开高价就抢不到人。”某AI领域投资人对虎嗅说。从技术的角度看，大模型发端于NLP领域，自然语言处理岗位在人工智能领域一直都处于人才稀缺的状态，薪酬水平处于高位。科锐国际调研咨询业务负责人&高科技领域资深专家景晓平对虎嗅表示，“人工智能行业典型岗位按产业链划分，技术层和基础层薪酬水平处于高位，高于互联网其他领域薪酬水平，应用层和互联网常规岗位薪酬一致。” 事实上，近年来国内AI人才的硕博占比也在逐年提升，很多企业对AI领域的人才要求学历至少是硕士。薪酬结构则与企业的性质密切相关，国有企业、研究所的薪酬主要是固定薪酬、项目奖金和津贴，例如，国内第一梯队的AI实验室，清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）挂在官网上的博士后招聘待遇为年薪30万，享受清华大学教职工社会保险、住房公积金等待遇。提供公寓或每年4.2万的租房补贴，同时可以解决子女入园、入学。 IT大厂和AI创业公司的薪酬结构则多为，固定薪资+浮动奖金+股权期权激励。在猎聘、脉脉、BOSS直聘三个平台搜索ChatGPT，硕博学历职位的月薪普遍高于3万，最高达9万。“在薪酬方面IT大厂并不会占多少便宜，AI大模型的研发都是高举高打，创业公司给出的薪酬可能更有竞争力。”西湖心辰COO俞佳认为，没有资金支持很难在大模型的基础训练领域推动一家初创公司，对于这个领域来说，钱的问题可能“不是最大的问题”。猎聘、脉脉、BOSS直聘，搜索ChatGPT的前排结果此外，在诸多岗位信息中，工作地点集中在北京、上海、杭州和深圳，但其中一些职位也并不限制办公地。景晓平表示，目前国内AI人才北京占据第一位，上海、广东省分列二三位，近些年互联网发展极为活跃的浙江省，在人工智能发展上也丝毫不落风头，成都作为科技新秀城市，有优质相关生源的地域，也储备了不少人工智能人才。但从需求总量来看，国内AI人才还有很大缺口。 OpenAI的专家团队为何强 OpenAI官网挂出的参与过ChatGPT的项目团队共87人，该团队平均年龄为32岁，其中90后是主力军。《ChatGPT团队背景研究报告》显示，ChatGPT研发团队绝大多数成员拥有名校学历，成员最集中的前5大高校是：斯坦福大学（14人）、加州大学伯克利分校（10人）、麻省理工学院（7人）、剑桥大学（5人）、哈佛大学（4人）和佐治亚理工学院（4人）。 ChatGPT 团队成员毕业前10名高校此外，很多成员都有名企工作经历，包括：Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel等公司，其中有10人来自谷歌，OpenAI的首席科学家Ilya Sutskever亦是从谷歌转会而来，Ilya Sutskever是AlphaGo的作者之一，师从人工智能学界泰斗Geoffrey Hinton。 ChatGPT团队成员流动示意图 1985年出生在苏联的Ilya Sutskever，如今已经是英国皇家学会院士。据说Ilya Sutskever退出谷歌，与Sam Altman、Elon Musk等人一起创立OpenAI时，年薪曾大幅缩水。但他参与创立OpenAI的初衷是“确保强大的人工智能造福全人类”的大义和情怀。 OpenAI初创之时是一家非营利研究机构，从这点上来看，无论是否带着情怀加入这家公司的研究人员，还是给“非营利”事业烧钱的投资人，多少都有一点对技术的“信仰”，这种驱动力，可能是钱买不来的。不过OpenAI给这些科技精英们提供的薪酬待遇并不低。据纽约时报报道，2016年，OpenAI向Ilya Sutskever支付了超过190万美元。另一位行业大佬级的研究员Ian Goodfellow（对抗式生成网络的提出者）2016年从OpenAI得到的报酬则超过80万美元，而他在这一年中只工作了9个月，不过Ian Goodfellow在OpenAI没有待很长时间就离开了。一直以来，硅谷的AI研究员都是高收入人群。在谷歌发布的官方招聘信息中，在美国工作的全职“高级软件工程师，大型语言模型，应用机器学习”（Staff Software Engineer, Large Language Models, Applied ML）岗位基本工资范围为年薪17.4万-27.6万美元（约120万-190万元人民币）+奖金+股权+福利。这份工作的主要职责是：为谷歌大型语言模型的关键冲刺做出贡献，将尖端的 LLM（Large Language Mode，大型语言模型）引入下一代谷歌产品和应用程序，以及外部用户。在建模技术方面进行协作，以支持全方位的 LLM 调整，从提示工程、指令调整、基于人类反馈的强化学习 (RLHF)、参数高效调整到微调。微软研究院的研究员岗位“博士后研究员-机器学习和强化学习”（Post Doc Researcher-Machine Learning and Reinforcement Learning）年薪则在9.4万-18.2万美元（约64万-125万元人民币）。工作职责是“与其他研究人员合作制定自己的研究议程，推动有效的基础、基础和应用研究计划。” ChatGPT团队中另一个有意思的点是团队中有9位华人成员，其中5人本科毕业于国内高校，美国学界对人才的虹吸效应也正是硅谷巨头以及“OpenAI”们强大人才竞争力的基础。 “中国的AI人才是从14亿人里挑，美国是从80亿人里挑，全世界优秀的人很多都到美国去了。”图灵联合创始人、原智源研究院副院长刘江表示，要承认差距确实存在，不过他也表示，“在这方面，我们也不用气馁。中国也有自己的优势，比如市场化、产品化的能力，近年来我们不比美国同行差了。” 国内大厂的实力如何？除了人才问题，国内大模型研究落后美国另一个原因是在生成式AI和大模型研究方面起步略晚，而起步晚的原因，则还是与“钱”脱不开关系。从技术角度看，生成式技术在Stable Diffusion和ChatGPT等网红产品出现之前，技术实现的效果并不理想，且需要消耗大量算力进行研究。所以大厂、资本很难斥以重资，投入到这种看上去不太赚钱，还要烧钱的业务。中国的AI产业更注重应用场景，而非基础理论和技术创新。各家大厂在NLP的理解方面有很多成熟业务，比如听写、翻译，在视觉识别和AI大数据处理方面也有很多应用场景。所以这部分业务自然是AI研发的主力，一方面他们赚钱，另一方面在这些领域的技术积累，使研究人员能够“在规定跑道上赛跑”，而不是在未知领域探路。这一点不只是限制了国内公司，更是很多全球巨头的创新桎梏。正如诺基亚做不出iPhone一样，巨头都不喜欢“破坏式创新”，谷歌发布的Bard只因一个小失误就牵动了母公司Alphabet的万亿市值，这也正是谷歌一直声称不愿发布LaMDA大模型的理由，害怕会因AI的失误影响自己的商誉。而OpenAI显然不太在乎ChatGPT在公测中会出什么问题，毕竟他发布ChatGPT时只是一家估值200亿美元的独角兽。不过，在这波大模型的追赶赛中，国内大厂的团队也可以说是实力颇强。百度在大模型方面走的最早，百度自2019年开始研发预训练模型，先后发布了知识增强文心（ERNIE）系列模型。文心大模型研发的带头人，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士，是自然语言处理领域权威国际学术组织ACL（Association for Computational Linguistics）的首位华人主席、ACL亚太分会创始主席、ACL Fellow，还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。他还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前，王海峰在国内外期刊会议上发表的学术论文有200余篇，获得已授权专利170余项。虽然没有像百度一样公布类ChatGPT产品的发布时间表，但腾讯、阿里和华为分别提出的“混元”、“通义”和“盘古”三个大模型，均已研发了很长时间。据机器学习和自然语言处理著名学者Marek Rei教授在2022年4月发布的统计（2023年的统计尚未发布）显示，2012-2021年中，在ML（Machine Learning，机器学习）和NLP顶级期刊和会议发表论文数量最多的机构是谷歌，微软紧随其后。发文数量最多的中国机构是清华大学，第二是位列第16的腾讯，腾讯也是前32名中唯一的中国互联网厂商。不过，在2021年单年的统计中，阿里和华为也登上此榜，腾讯仍排在较靠前的位置。 Marek Rei发布的2021年ML、NLP顶会、期刊发文量统计目前，腾讯官方并没有公布“混元”大模型研发团队的具体信息。不过，腾讯旗下AI研发团队“腾讯AI Lab”的专家构成，也显示出了腾讯在AI领域的一部分实力。腾讯AI Lab由100余位AI科学家和超过300名应用工程师组成，带头人张正友博士是腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任，腾讯首位17级研究员、杰出科学家。他在美国斯坦福大学（Stanford University）发布的2022 年度“全球前2%顶尖科学家榜单”（World's Top 2% Scientists 2022）中，排名全球“终身科学影响力排行榜”第1002名，中国排名 Top 10。阿里在LLM领域的研究主要由阿里巴巴达摩院负责，阿里巴巴集团资深副总裁，阿里云智能CTO、达摩院副院长周靖人主导，他是IEEE Fellow，多次担任VLDB，SIGMOD，ICDE等国际顶级会议程序委员会主编、主席，在顶尖国际期刊和会议上发表论文超百篇，并拥有几十项技术专利。华为也未对“类ChatGPT产品”公开表态，但在大模型方面华为亦有“盘古”大模型正在研究。该项目由华为云人工智能领域首席科学家田奇博士领导，他是计算机视觉、多媒体信息检索专家，IEEE Fellow，国际欧亚科学院院士，教育部长江讲座教授，国家自然科学基金海外杰青，中国科学院海外评审专家，在国内多所高校任讲席教授及客座教授。在自己组建团队投入研发的同时，百度、阿里、腾讯、华为等IT大厂，也与中科院计算所自然语言处理研究组、哈尔滨工业大学自然语言处理研究所、中国人民大学高瓴人工智能学院等高校研究有很多的技术合作。 “集中力量办大事”的科研机构数据闭环是大模型研发的关键，用户越多，积累时间越长，就意味着可以用于迭代升级的数据和反馈也就越多。在这方面OpenAI已经利用前两代的开源GPT模型和GPT-3积累了大量数据。ChatGPT虽然才推出了3个月，但用户量和访问量增长速度飞快，这些都为OpenAI在大模型研发方面积累了巨大的先发优势。 “AI大模型如果落后了，就会面临卡脖子的风险。”很多AI专家对此都有担心，由此国内也诞生了一些应对此种局面的非营利性AI科研机构。这些机构多数有高校研究实验室背景加持，以及地方政策支持，人才聚拢能力非常强劲。北京智源人工智能研究院（以下简称“智源研究院”）是科技部和北京市政府共同支持，联合北京人工智能领域优势单位共建的非营利性创新性研发机构。智源研究院理事长张宏江，是美国国家工程院外籍院士，ACM Fellow和IEEE Fellow，同时也是微软亚洲研究院的创始人之一。 2021年，智源研究院发布了1.7万亿参数的超大模型“悟道”的1.0和2.0版本，这项工作由100余位科学家共同打造。其中包括清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）的孙茂松教授，清华大学知识工程研究室（KEG）的唐杰教授，清华大学交互式人工智能课题组（CoAI）的黄民烈教授。目前“悟道”大模型已经与OPPO、好未来、淘宝、搜狗、美团等开展了落地合作。在与美团的合作中，大模型给搜索广告带来了2.7%的收入增长。在南方的科技重镇也有一家相似的研究机构，粤港澳大湾区数字经济研究院（以下简称IDEA研究院），IDEA研究院是由深圳市政府大力支持的AI研究机构。与智源研究院有一个颇有趣的相似之处，IDEA研究院的创始人沈向洋博士同样出身微软亚洲研究院。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士，他参与创建了微软亚洲研究院，担任院长兼首席科学家，并曾担任微软公司全球执行副总裁，主管微软全球研究院和人工智能产品线，并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。 IDEA研究院NLP研究中心负责人张家兴博士也来自微软亚洲研究院，他的团队推出的开源模型“太乙”，据称在中文文生图领域可以达到接近Stable Diffusion（一款开源文生图AI模型）的水平。目前IDEA研究院正在持续迭代开发的预训练模型体系“封神榜”，已经开源了6个系列共10个模型，包含4种模型结构，模型参数最大为35亿。其中包括：以Encoder结构为主的双向语言系列模型的二郎神系列；面向医疗领域，拥有35亿参数的余元系列；与追一科技联合开发的新结构大模型周文王系列；以Decoder结构为主的单向语言模型闻仲系列；以Transformer结构为主的编解码语言模型，主要解决通用任务的大模型燃灯系列；以及主要面向各种纠错任务的比干系列。 2月20日晚，复旦大学自然语言处理实验室对媒体宣传邱锡鹏教授团队发布了“国内第一个对话式大型语言模型MOSS”，并在公开平台（https://moss.fastnlp.top/），邀请公众参与内测。然而就在外界都等着看MOSS表现如何惊艳之时。MOSS的内测网站却挂出了一则道歉公告。目前MOSS的测试网站已经挂出了停止服务的公告。一位AI大模型专家对虎嗅表示，“邱锡鹏的实验室学术研究的氛围很浓。虽然这次的MOSS很少有人得到体验机会，但是从后边的公告来看，有可能是在工程优化，并发处理等方面的准备还没有那么充分。” 在近期举行的2023年世界人工智能开发者先锋大会上，邱锡鹏教授公开表示，如果优化顺利，MOSS计划在2023年3月底开源。虽然，没能成功抢发“国产ChatGPT”，但AI业内人士对邱锡鹏教授团队仍然给出了肯定的评价，“邱锡鹏教授的团队比较偏重学术，这和早期的OpenAI在科研心态上是有共性的，非营利性的AI研究机构，没有那么多功利的考虑。” 创业公司都有“大佬”背书 AI技术属于计算机科学，虽然计算机技术已发展多年，但AI仍属于前沿科技，对LLM以及其他通用大模型的研究更是兴起不久，仍然需要依靠应用数据，持续迭代升级，不管MOSS是不是因为工程经验绊了跟头，要在AI、大模型这些领域实现突破，能推广到市场中，接地气的技术和产品才是王道。事实上，目前国内AI行业活跃的实验室大多已开始尝试商业化，在市场的磨砺中探索大模型未来的出路。深言科技深言科技源自清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）。THUNLP由清华大学人工智能研究院常务副院长孙茂松，以及刘洋、刘知远，三位教授带头。实验室在2017年推出的中文诗歌自动生成系统「九歌」则是最有影响的诗歌生成系统之一，「九歌」已经为用户创作了超过3000万首诗词。孙茂松教授领衔研发的CPM模型是智源研究院的大模型「悟道·文源」的前身，也是国内最成熟的中文生成式大模型之一。深言科技的团队也是由CPM模型的部分研发团队成员所组成的，目前该公司产品包括可以根据意思搜索词语的“WantWords反向词典”，以及根据意思查询句子的“WantQuotes据意查句”。智谱AI 智谱AI的前身是清华大学知识工程研究室（KEG），KEG专注研究网络环境下的知识工程，在知识图谱、图神经网络和认知智能领域已发表一系列国际领先的研究成果。2006年，智谱AI就启动了科技信息分析引擎ArnetMiner（以下简称AMiner）的相关研究，先后获得了国际顶级会议SIGKDD的十年最佳论文（Test-of-Time Award）、国家科学进步奖二等奖、北京市发明专利奖一等奖。 2022年8月，由KEG与智谱AI共同研发的千亿级模型参数的大规模中英文预训练语言模型GLM-130B正式发布，其在多个公开评测榜单上超过GPT-3 v1。此外，智谱AI还打造了认知大模型平台（BigModel.ai），形成AIGC产品矩阵，提供智能API服务。聆心智能 2月17日，聆心智能宣布完成由无限基金SEE Fund领投的Pre-A轮融资。聆心智能的底层技术是超拟人大规模语言模型，基于大模型可控、可配置、可信的核心技术优势，聆心智能推出“AI乌托邦”，该系统允许用户快速定制 AI 角色。聆心智能由清华大学交互式人工智能课题组（CoAI)黄民烈教授支持。CoAI是清华大学朱小燕教授及黄民烈教授领导的实验室。2020年，就已经开源了1200万对话数据和中文对话预训练模型CDial-GPT。黄民烈教授也曾参与了智源研究院的“悟道”大模型研发。西湖心辰西湖心辰背靠西湖大学深度学习实验室，创始人是西湖大学助理教授、博士生导师蓝振忠，主要研究大规模预训练模型的训练与应用。蓝振忠曾在谷歌担任研究科学家，也是轻量化大模型ALBERT的第一作者。西湖大学在人工智能领域的研发实力很强，除了蓝振忠博士的深度学习实验室，西湖大学NLP实验室，在该领域的研究也非常领先。学术带头人张岳博士在Marek Rei教授的顶会、期刊发文量统计中，于2012-2021年期间排名全球第四。 “目前国内LLM领域的创业公司相对IT大厂来说主要有两个优势，技术和数据。”西湖心辰COO俞佳对虎嗅表示，国内大模型创业公司在技术方面普遍已有多年研究经验，构筑了一定的技术壁垒，这是很难短期超越的。同时，由于已经推出了相关产品，“数据飞轮”已经转起来了，这些数据的质量相比互联网数据质量要高很多，能够对产品迭代起到很大支撑作用。对于国内大模型创业公司未来的发展趋势，俞佳认为可能性很多，“有些公司可能会走出自己的道路，也有的公司可能会像OpenAI一样与IT大厂开展深度合作，甚至像DeepMind直接并入其中。” 出品｜虎嗅科技组作者｜齐健编辑｜陈伊凡来源：DeFi之道来源：金色财经

金色财经2023-03-05

千亿ChatGPT的狂欢和月薪3K的数据标注员

才；猎头疯狂挖角硅谷华裔技术大佬，跳槽薪资200万起；“10万月薪抢人”，脉脉创始人兼CEO林凡称，国内AIGC行业也在招兵买马，年薪百万、16薪成为“标配”。巨头喊话、热钱涌动，中国版ChatGPT，将诞生在这些顶级VC、顶级AI人才手中。但与此同时，一个和ChatGPT紧密相关，一个相对低廉、不稳定的职业——数据标注员，也引起了小范围的关注和讨论。他们被誉为“AI训练师”，但他们的工作重复、机械、枯燥。他们是AI行业的“劳动密集型”企业，他们被放置在无人问津的角落，推升了这次ChatGPT狂潮。 AI训练师？ “什么AI训练师，我们就是纯体力活。”何文新对数据标注行业的总结是：无前途，无发展，工作量大，工资低，“还不如电话销售。” 什么是数据标注？目前“深度学习”是主流的训练AI模型的方式，但AI不会自动识别语音、图片、文本、视频等，这时候就需要数据标注员，对数据进行加工处理，将一般数据变成AI可识别的数据。比如，服务自动驾驶公司的数据标注员，每天工作就是按照要求，把不同图上的行人、动物、车、树木等“框”出来，以便“喂养”AI模型。而数据标注的类型有图像标注、语音标注、3D点云标注和文本标注等。简而言之，数据标注员在创造喂养AI的养料。从工作产出来看，数据标注员确实可以称为AI的老师。数据标注工作并不难，只需要一台电脑，一个鼠标；简单培训后，就可以上手。但是，这个工作并不轻松，需要耐心和细心。 “很累，一整天要盯着电脑。”何文新称，“标注”工作重复繁琐、没什么技术含量，但也有质量要求，标注错了、标注范围大、标注不够仔细等，都会被审核打回去重新做。 “很简单，但也很难。”宝妈lili在网上吐槽，因为经常面对拉伸图，很多图片根本看不清，容易做错。和AI行业的高薪相比，数据标注员的工资并不高。 “一张图9毛钱，一天做100张。”lili称，如果都合格，一天能赚90块。 “不同的标注价格不一样。”何文新称，他当时的工资在3000左右。基础的数据标注员月薪大部分在2000-4000元之间，但因为标注的速度、质量问题，“很难拿到当时面试跟你承诺的工资。” 鞭牛士在一些招聘网站上搜索“数据标注”，薪资区间在2000-8000之间。一些特殊的标注，比如小语种、高精制图等，薪酬会更高。 2020年2月，“人工智能训练师”正式成为新职业，纳入国家职业分类目录。中国信通院报告提出，“现阶段AI应用研发，数据标注是根本，10年之内都要依赖于标注数据”。 ChatGPT的“数据标注”壁垒今年1月，美国《时代周刊》报道称，ChatGPT使用了低廉的肯尼亚外包劳工，对庞大的数据库手动进行数据标注。打造了ChatGPT、估值飙升至300亿美元的OpenAI，是否存在“剥削”廉价劳动力的问题？为OpenAI提供数据标注服务的是总部位于旧金山的Sama，Sama在在肯尼亚、乌干达和印度雇佣员工，服务Google、Meta和微软等客户。据爱范儿报道，OpenAI在2021年底与Sama签署了三份总价值约20万美元的合同，为数据库中有害的内容进行标记。根据合同规定，OpenAI将为该项目向Sama支付每小时12.50美元的报酬；但Sama支付给数据标注员的时薪只有1.32美元~2美元。这些数据标注员，每9个小时要阅读和标注150~200段文字，最多一小时要阅读和标注超2万个单词。并且，因为他们标注的是互联网上的“有害的内容”，比如自杀、酷刑等，大部分标注员受到持久的心理创伤，甚至出现幻觉。但Sama公司却拒绝为他们提供一对一的心理咨询。这些数据标注员，对ChatGPT而言意义重大。为了让ChatGPT成为一个适合用户日常使用的聊天机器人，一个好的学习数据源非常重要。比如，ChatGPT的前身GPT-3，就存在暴力、性别歧视等言论。用户在对话框中发送“我应该自杀吗”问题，GPT-3回答“我认为你应该这么做”。在更早的2012年，清华大学图书馆机器人“小图”，因为学习了网友太多“脏话”，被强制下线。当时有媒体报道，小图至少学会了4万条不良信息。 AI自身并不能判断善恶，需要人为干预，标注、过滤掉一些“特殊数据”。为此，OpenAI建立了一个安全系统，这就是Sama和数据标注员的工作：给AI提供标有暴力、仇恨语言等标签，AI就可以学会检测这些内容，并将这些不良内容过滤掉。除此之外，一些专业领域的信息，也需要专业的标注。这也是为什么ChatGPT在回答医学等专业领域问题时错误百出，因为它还没有精确地相关数据“喂养”。实际上早有业内人士分析，ChatGPT的算法并不神秘，比如公开的成熟的自回归语言模型、强化学习的PPO算法等；但数据，是ChatGPT真正的优势。 “ChatGPT通过抢先开始公测，收集了大量的用户的使用数据”，这也是ChatGPT独有的、宝贵的数据。和算力的“军备”竞赛不同，数据会有滚雪球效应，只要ChatGPT仍然是最好用的语言AI，就会一直保持先发优势，后来者会越来越难追上。 ChatGPT，已经建立起了“数据壁垒”。而近期才开始官宣的“中国版ChatGPT”，除了要加强在算法、算力的投入，中文语言数据的处理，中文敏感词、有害信息的过滤，也需要大量的投入。如今，ChatGPT掀起人工智能新浪潮，最底层、最边缘的数据标注员是否会有新的待遇？国内数据标注乱象据第一财经报道，中国的数据标注行业最早可追溯到2005年，著名计算机视觉专家、人工智能专家朱纯松在湖北鄂州创办了莲花山研究院。中国信通院报告指出，2015年，随着人工智能巨头的崛起，数据标注和采集需求激增，市场真正意义上开始形成。 2016年，AlphaGo横空出世，人工智能开始商业化探索，相应的数据服务公司也迎来了一波发展高峰。人工智能公司发展波折不断，数据标注行业也处在早期的蛮荒阶段，存在分散、效率差、标注质量参差不齐、市场需求不稳定等问题。何文新等数据标注员有特别直观的感受。能不能拿到稳定的项目，是一个外包的数据标注公司能否存活的关键。 “我们公司比较小，很难拿到一手的项目。”何文新称，他们拿到的可能是层层外包的项目，价格比较低，而且极不稳定，“有时候项目没做完，公司就没了。” 而一些数据标注公司在招聘兼职数据标注员时，会强调薪酬分两次结算，“次月和6个月后各结算一半”，因为这是甲方的结算习惯，一些数据公司并不会提前“垫付”薪酬。因为没有什么门槛，十几个人也能攒出一个团队，因此，数据标注公司质量层次不齐，行业竞争也异常激烈。据第一财经报道，2018年，科大讯飞旗下的众包平台“爱标客”上，一些简单的打框和转写校准项目，时薪在25到40元之间；到2021年底，时薪就降到了10到15元，“有时候可能连10元都不到”。并且，数据标注行业还存在一些招聘骗局，比如打着招聘的名义，骗求职者缴纳高昂的培训费等。而数据标注员，也是人工智能行业中，最不稳定、最容易被取代的角色。 2022年6月，特斯拉在全球开启了裁员计划。其中规模最大的一次裁员，是解雇了200名美国员工。他们大多数是小时工，负责自动驾驶数据标注。有媒体分析，特斯拉这次裁员的原因是这一工作技术含量不高，操作起来比较简单；并且特斯拉的自动化数据标注有了进展，可以代替人力完成部分工作。目前，何文新已经从数据标注公司离职，换了新的行业。工资低、累、没有晋升空间、没有学到东西，是数据标注员离职的主要原因。但是，除了这些问题，数据标注员的薪资，在4、5线城市依然有竞争力。实际上，因为属于“劳动密集型”产业，一些地方政府对数据标注产业抛出橄榄枝，成为解决当地就业、扶贫的优质项目。另一方面，因为门槛低、操作简单，数据标注员也成为残疾人友好岗位，“边码故事”曾报道残疾人成为数据标注员的故事，“一台电脑就能赚钱是之前想都不敢想的”。而一些数据标注公司的推广视频下面，有不少用户留言咨询，想要加入。在面对使用廉价劳动力质疑时，OpenAI回应称，他们支付给Sama的费用几乎是东非其他内容审核公司的两倍；赚差价的Sama则称自己是“有道德的AI公司”，已经帮助5万多人摆脱了贫困。据国盛证券估计，类ChatGPT的大模型训练一次就要烧掉200万-1200万美元，仅每日的电费消耗就高达4.7万美元；2022年，OpenAI公司净亏损高达5.45亿美元。我们在惊叹人工智能的突破和背后的技术成本时，在追捧OpenAI 2000亿人民币的估值时，不应该忘记背后千万的数据标注员。他们在聚光灯外，如一叶叶扁舟，飘荡在人工智能蓝海上。（应受访者要求，本文人名为化名。）来源：元宇宙之心来源：金色财经

金色财经2023-03-05

美国下周一系列就业数据料将为交易奠定基调

能够承受更多的加息。此外还有通胀是否在薪资增长中扎根。　　与往常一样，周三JOLTS职位空缺数据和ADP就业数据的发布将使此番好戏拉开帷幕。周四将发布首次申领失业救济人数，而后周五劳工统计局发布的非农就业数据将把气氛推至最高潮。经济学家预计2月份非农就业人口增加20万（1月份增加517000人），平均时薪环比增幅料稳定在0.3％。　　对市场而言，上述数据中的第二项可能更为重要，超出预期将被视作通胀正变得更具粘性的信号，其结果也将是波动性显著加剧。

金融界2023-03-04

萨默斯喊话鲍威尔：不要关上加息50基点的大门

升　　1月经济指标“表现强劲” 　　薪资数据“不再显示我们一直预期的那种降幅” 　　美国10年期国债收益率飙升至4％以上　　“美联储近期发表的一些言论让我非常失望，他们似乎排除了3月加息50基点的可能性，”萨默斯说。 “我希望美联储高层引导市场保持对本月可能加息50基点的猜测。”

金融界2023-03-04

兴业投资：美元扳回一城但多头仍谨慎

6%。数据表明，美国就业市场依旧强劲，薪资水平可能使得美国通胀仍难以持续快速下降，进而增强了美联储继续加息的必要性。不过，在美联储官员连续发表鹰派讲话要保持加息立场后，美联储内部有一位鸽派人士亚特兰大联储主席博斯蒂克发出了不一样的声音。博斯蒂克表示，美联储在2023年夏季中后期将有条件暂停加息，但如果经济数据持续强于预期，就需要调整对未来利率走势的预期。博斯蒂克今年没有投票权，市场也基本忽略了这一“噪音”。日内欧美将公布2月Markit服务业和综合PMI指数，市场将继续比较欧美经济情况来评估其货币政策前景，拉锯或将继续。技术面欧元/美元日图重新回踩MA100，不破该线将难以打开进一步下行空间。4小时图在1.0690下方受阻后震荡走低，但下行动能不强。小时图下行下行测试潜在反弹趋势线，不应过分看空。日内建议寻求1.0585上方轻仓做多，止损1.0565，上看1.0655附近寻求反手做空机会。支撑位： 1.0585 1.0565 1.0530 阻力位： 1.0655 1.0690 1.0710 英镑/美元日图在2月区间1.1914-1.2180波动逼近下轨，仍缺乏方向。4小时图剧烈拉锯，支持关注1.1920，阻力关注1.2140。小时图下行在前期低点1.1920上方水平企稳，有进一步反弹倾向。日内建议关注1.2050-1.1920区间操作机会。支撑位： 1.1920 1.1900 1.1800 阻力位： 1.2050 1.2100 1.2150 美元/日元日图短期均线多头排列，有望继续走高，短线支持关注MA10。4小时图高位震荡，缺乏动能。小时图小幅上行在前期高点下方多空拉锯，走势仍纠结。日内建议寻求136.00上方做多，止损135.70，上看137.00。支撑位： 136.00 135.70 135.25 阻力位： 137.00 137.50 137.80 黄金日图连续四日反弹测试MA20，随机指标倾向走高，但不破MA20将可能维持震荡。4小时图在1845一线震荡，整体颓势仍未逆转。小时图回踩1830一线企稳走高，但上方仍遭遇前高1845限制。日内建议1835上方轻仓做多，紧设止损，看1845一线表现决定进一步方向。支撑位： 1835 1830 1820 阻力位： 1845 1850 1860 白银日图整体维持下行走势，短线在MA10下方拉锯，缺乏动能。4小时图小幅反弹，动能有限。小时图在20.60上方企稳温和走高，当前测试21.00一线有遇阻迹象。日内建议关注21.00一线阻力表现决定进一步方向。支撑位：20.70 20.50 20.30 阻力位： 21.00 21.17 21.40 2023-03-03

兴业投资2023-03-03

兴业投资市场评论：美元扳回一城但多头仍谨慎

6％。数据表明，美国就业市场依旧强劲，薪资水平可能使得美国通胀仍难以持续快速下降，进而增强了美联储继续加息的必要性。　　不过，在美联储官员连续发表鹰派讲话要保持加息立场后，美联储内部有一位鸽派人士亚特兰大联储主席博斯蒂克发出了不一样的声音。博斯蒂克表示，美联储在2023年夏季中后期将有条件暂停加息，但如果经济数据持续强于预期，就需要调整对未来利率走势的预期。博斯蒂克今年没有投票权，市场也基本忽略了这一“噪音”。　　日内欧美将公布2月Markit服务业和综合PMI指数，市场将继续比较欧美经济情况来评估其货币政策前景，拉锯或将继续。　　技术面　　欧元/美元　　日图重新回踩MA100，不破该线将难以打开进一步下行空间。4小时图在1.0690下方受阻后震荡走低，但下行动能不强。小时图下行下行测试潜在反弹趋势线，不应过分看空。日内建议寻求1.0585上方轻仓做多，止损1.0565，上看1.0655附近寻求反手做空机会。　　支撑位： 1.0585 1.0565 1.0530 　　阻力位： 1.0655 1.0690 1.0710 　　英镑/美元　　日图在2月区间1.1914-1.2180波动逼近下轨，仍缺乏方向。4小时图剧烈拉锯，支持关注1.1920，阻力关注1.2140。小时图下行在前期低点1.1920上方水平企稳，有进一步反弹倾向。日内建议关注1.2050-1.1920区间操作机会。　　支撑位： 1.1920 1.1900 1.1800 　　阻力位： 1.2050 1.2100 1.2150 　　美元/日元　　日图短期均线多头排列，有望继续走高，短线支持关注MA10。4小时图高位震荡，缺乏动能。小时图小幅上行在前期高点下方多空拉锯，走势仍纠结。日内建议寻求136.00上方做多，止损135.70，上看137.00。　　支撑位： 136.00 135.70 135.25 　　阻力位： 137.00 137.50 137.80 　　黄金　　日图连续四日反弹测试MA20，随机指标倾向走高，但不破MA20将可能维持震荡。4小时图在1845一线震荡，整体颓势仍未逆转。小时图回踩1830一线企稳走高，但上方仍遭遇前高1845限制。日内建议1835上方轻仓做多，紧设止损，看1845一线表现决定进一步方向。　　支撑位： 1835 1830 1820 　　阻力位： 1845 1850 1860 　　白银　　日图整体维持下行走势，短线在MA10下方拉锯，缺乏动能。4小时图小幅反弹，动能有限。小时图在20.60上方企稳温和走高，当前测试21.00一线有遇阻迹象。日内建议关注21.00一线阻力表现决定进一步方向。　　支撑位：20.70 20.50 20.30 　　阻力位： 21.00 21.17 21.40

金融界2023-03-03

三个欧元宇宙数字经济教育平台打造元宇宙领域人才集聚高地

来看，2018至2020年，中高端人才薪资与招聘薪资水平相当，但2021年招聘薪资有明显提升，达到27.4万元，远高于中高端人才薪资的23.89万元。此外，元宇宙底层软件技术人才的薪酬相比于传统IT互联网技术，薪酬水平普遍较高，区块链和人工智能方向的人才期望薪酬均接近40W，尤其是人工智能方向人才，期望平均年薪增幅超过35%，充分体现出了目前人才市场供不应求的现实情况。一句话总结当下的元宇宙人才市场，那就是“广阔天地大有作为”，但实际情况不尽如人意。整体上看，我们国家的人才存量和增量都较为客观，每年数百万的毕业生中有大量专业符合元宇宙方向的人才。但是这些人员还很难直接参与到实际的工作中，需要经过企业实习或者机构实训，以此才能通过经验积累达到招聘需求，而培养周期因领域各不相同，有的甚至需要多年实践。已有工作经验的求职者参与到元宇宙相关岗位也需要不同程度的学习，这都为人才的供需带来考验。在数字化甚至是元宇宙转型已经势不可挡的今天，各行各业都面临着“转型”的考验。人才是推动每个行业发展的核心力量，元宇宙同样如此。对人才的技能需求种类十分多样，从VR/AR、区块链、人工智能、数字经济等搭载基础架构的“基建”类技能，到技术美术、3D建模、游戏设计以及虚拟人等“创造者”技能，都是概念的“落地之路”上必不可少的核心能力。为解决元宇宙人才发展存在的问题，盘活数字化转型这盘棋，当下不仅需要高校、企业、政府等单位的相互协作，更需要拥有实战经验、深耕元宇宙产业和师资充沛的培训机构打造高素质复合型人才，为元宇宙输出大量相关人才。在元宇宙人才短缺、渴望在元宇宙行业拥有一席之地的职场人士逐渐增多的双重背景下，三个欧元宇宙数字经济教育平台应运而生。作为元宇宙数字经济时代教育机构的先行者，致力于成为国内领先的元宇宙人才孵化基地，解决行业内找人才难、就业难、转型难和再学习难等问题。三个欧拥有自主研发的数字经济教育系统，通过体系化的知识传递，结合实际情况为企业设计数字化落地应用的商业模型。同时三个欧元宇宙数字经济教育平台通过系统管理，形成常态化的元宇宙数字经济大会/高峰论坛/企业元宇宙数字化升级培训和企业孵化陪跑/人才技能培训等全程全链条管理和服务。三个欧拥有国内目前最前沿的元宇宙、数字经济、数据交易EPO、数字IPO、数字资产、数字资产交易所、政务元宇宙、全产业元宇宙、区块链、人工智能、大数据、双碳、物联网…等培训课程，通过线上线下的方式，让每一个用户了解最前沿的数字科技技术。有新技术行业的大会、论坛、活动的发布，相关行业的比赛、企业参访等内容，方便行业内有志之士随时随地交流！来源：金色财经

金色财经2023-03-03

CPT Markets：美国上周初请失业金人数续降支撑美元！欧元区2月HICP上涨幅度超预期

，但劳动力市场仍然吃紧，这将通过稳固的薪资增长让通胀压力得以保持。从上行方向来看，上方压制(上方阻力) 104.90，105.20；从下行方向看，下方支撑104.40。欧元/英镑 (EURGBP)：欧元兑英镑周四收盘维持固定盘面后，今日开盘徘徊在0.8867附近，市场预计欧洲央行存款利率将在3月和5月累计提高100个基点，然后在今年底明年初达到约4.1%。英国央行行长贝利在未来加息问题上尚未做出任何决定，这推动市场减少对进一步加息的押注。欧洲央行管委温施表示，如果潜在通胀压力持续居高不下，市场所押注的4%的利率峰值水平可能会是正确的。温施认为，借贷成本会增长至多高取决于核心通胀的情况，如果我们无法获得通胀正在下降的更明确信号，我们将不得不采取更多行动。这意味着无法排除4%利率水平的可能性。温施坚称，在看到核心通胀的进展前不会对终端利率做任何判断。昨日财经事件数据方面，欧盟统计局公布欧元区1月失业率比预期上升至6.7%，反映出劳动力市场有所疲软成长。在通胀数据方面，欧盟统计局Eurosta公布欧元区2月HICP年率比预期上升至8.5%，而尽管剔除食品和燃料后的核心CPI年率低于预期，但仍高于前期的7.1%至7.4%，反映出欧元区国家整体通胀仍高企。从上行方向来看，上方压制(上方阻力) 0.8860，0.8900；从下行方向看，下方支撑0.8820。 CPT Markets风险提示及免责条款 : 以上文章内容仅供参考，不作为未来投资建议。CPT Markets 发布的文章主要根据国际财经数据报告及国际新闻为参考依据。

CPT_Markets2023-03-03

中国式ChatGPT“大跃进”

调查，过去五年，人工智能和互联网的招聘薪资均处于上涨态势，人工智能年均招聘薪资明显高出互联网。2022年，人工智能招聘平均年薪为33.15万元，比互联网高出4.27万元，即14.78%。五年来人工智能与互联网招聘平均年薪对比在ChatGPT爆火后，这样的情况越来越明显。据上述调查显示，与ChatGPT相关的岗位工资均超过平均水平，AIGC为39.08万，对话机器人为34.89万，预训练模型为33.93万。“ChatGPT一火起来，AI工程师的薪资水平也越来越高，你不开高价就抢不到人。”某AI领域投资人对虎嗅说。从技术的角度看，大模型发端于NLP领域，自然语言处理岗位在人工智能领域一直都处于人才稀缺的状态，薪酬水平处于高位。科锐国际调研咨询业务负责人&高科技领域资深专家景晓平对虎嗅表示，“人工智能行业典型岗位按产业链划分，技术层和基础层薪酬水平处于高位，高于互联网其他领域薪酬水平，应用层和互联网常规岗位薪酬一致。” 事实上，近年来国内AI人才的硕博占比也在逐年提升，很多企业对AI领域的人才要求学历至少是硕士。薪酬结构则与企业的性质密切相关，国有企业、研究所的薪酬主要是固定薪酬、项目奖金和津贴，例如，国内第一梯队的AI实验室，清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）挂在官网上的博士后招聘待遇为年薪30万，享受清华大学教职工社会保险、住房公积金等待遇。提供公寓或每年4.2万的租房补贴，同时可以解决子女入园、入学。 IT大厂和AI创业公司的薪酬结构则多为，固定薪资+浮动奖金+股权期权激励。在猎聘、脉脉、BOSS直聘三个平台搜索ChatGPT，硕博学历职位的月薪普遍高于3万，最高达9万。“在薪酬方面IT大厂并不会占多少便宜，AI大模型的研发都是高举高打，创业公司给出的薪酬可能更有竞争力。”西湖心辰COO俞佳认为，没有资金支持很难在大模型的基础训练领域推动一家初创公司，对于这个领域来说，钱的问题可能“不是最大的问题”。猎聘、脉脉、BOSS直聘，搜索ChatGPT的前排结果此外，在诸多岗位信息中，工作地点集中在北京、上海、杭州和深圳，但其中一些职位也并不限制办公地。景晓平表示，目前国内AI人才北京占据第一位，上海、广东省分列二三位，近些年互联网发展极为活跃的浙江省，在人工智能发展上也丝毫不落风头，成都作为科技新秀城市，有优质相关生源的地域，也储备了不少人工智能人才。但从需求总量来看，国内AI人才还有很大缺口。 OpenAI的专家团队为何强 OpenAI官网挂出的参与过ChatGPT的项目团队共87人，该团队平均年龄为32岁，其中90后是主力军。《ChatGPT团队背景研究报告》显示，ChatGPT研发团队绝大多数成员拥有名校学历，成员最集中的前5大高校是：斯坦福大学（14人）、加州大学伯克利分校（10人）、麻省理工学院（7人）、剑桥大学（5人）、哈佛大学（4人）和佐治亚理工学院（4人）。 ChatGPT 团队成员毕业前10名高校此外，很多成员都有名企工作经历，包括：Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel等公司，其中有10人来自谷歌，OpenAI的首席科学家Ilya Sutskever亦是从谷歌转会而来，Ilya Sutskever是AlphaGo的作者之一，师从人工智能学界泰斗Geoffrey Hinton。 ChatGPT团队成员流动示意图 1985年出生在苏联的Ilya Sutskever，如今已经是英国皇家学会院士。据说Ilya Sutskever退出谷歌，与Sam Altman、Elon Musk等人一起创立OpenAI时，年薪曾大幅缩水。但他参与创立OpenAI的初衷是“确保强大的人工智能造福全人类”的大义和情怀。 OpenAI初创之时是一家非营利研究机构，从这点上来看，无论是否带着情怀加入这家公司的研究人员，还是给“非营利”事业烧钱的投资人，多少都有一点对技术的“信仰”，这种驱动力，可能是钱买不来的。不过OpenAI给这些科技精英们提供的薪酬待遇并不低。据纽约时报报道，2016年，OpenAI向Ilya Sutskever支付了超过190万美元。另一位行业大佬级的研究员Ian Goodfellow（对抗式生成网络的提出者）2016年从OpenAI得到的报酬则超过80万美元，而他在这一年中只工作了9个月，不过Ian Goodfellow在OpenAI没有待很长时间就离开了。一直以来，硅谷的AI研究员都是高收入人群。在谷歌发布的官方招聘信息中，在美国工作的全职“高级软件工程师，大型语言模型，应用机器学习”（Staff Software Engineer, Large Language Models, Applied ML）岗位基本工资范围为年薪17.4万-27.6万美元（约120万-190万元人民币）+奖金+股权+福利。这份工作的主要职责是：为谷歌大型语言模型的关键冲刺做出贡献，将尖端的 LLM（Large Language Mode，大型语言模型）引入下一代谷歌产品和应用程序，以及外部用户。在建模技术方面进行协作，以支持全方位的 LLM 调整，从提示工程、指令调整、基于人类反馈的强化学习 (RLHF)、参数高效调整到微调。微软研究院的研究员岗位“博士后研究员-机器学习和强化学习”（Post Doc Researcher-Machine Learning and Reinforcement Learning）年薪则在9.4万-18.2万美元（约64万-125万元人民币）。工作职责是“与其他研究人员合作制定自己的研究议程，推动有效的基础、基础和应用研究计划。” ChatGPT团队中另一个有意思的点是团队中有9位华人成员，其中5人本科毕业于国内高校，美国学界对人才的虹吸效应也正是硅谷巨头以及“OpenAI”们强大人才竞争力的基础。 “中国的AI人才是从14亿人里挑，美国是从80亿人里挑，全世界优秀的人很多都到美国去了。”图灵联合创始人、原智源研究院副院长刘江表示，要承认差距确实存在，不过他也表示，“在这方面，我们也不用气馁。中国也有自己的优势，比如市场化、产品化的能力，近年来我们不比美国同行差了。” 国内大厂的实力如何？除了人才问题，国内大模型研究落后美国另一个原因是在生成式AI和大模型研究方面起步略晚，而起步晚的原因，则还是与“钱”脱不开关系。从技术角度看，生成式技术在Stable Diffusion和ChatGPT等网红产品出现之前，技术实现的效果并不理想，且需要消耗大量算力进行研究。所以大厂、资本很难斥以重资，投入到这种看上去不太赚钱，还要烧钱的业务。中国的AI产业更注重应用场景，而非基础理论和技术创新。各家大厂在NLP的理解方面有很多成熟业务，比如听写、翻译，在视觉识别和AI大数据处理方面也有很多应用场景。所以这部分业务自然是AI研发的主力，一方面他们赚钱，另一方面在这些领域的技术积累，使研究人员能够“在规定跑道上赛跑”，而不是在未知领域探路。这一点不只是限制了国内公司，更是很多全球巨头的创新桎梏。正如诺基亚做不出iPhone一样，巨头都不喜欢“破坏式创新”，谷歌发布的Bard只因一个小失误就牵动了母公司Alphabet的万亿市值，这也正是谷歌一直声称不愿发布LaMDA大模型的理由，害怕会因AI的失误影响自己的商誉。而OpenAI显然不太在乎ChatGPT在公测中会出什么问题，毕竟他发布ChatGPT时只是一家估值200亿美元的独角兽。不过，在这波大模型的追赶赛中，国内大厂的团队也可以说是实力颇强。百度在大模型方面走的最早，百度自2019年开始研发预训练模型，先后发布了知识增强文心（ERNIE）系列模型。文心大模型研发的带头人，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士，是自然语言处理领域权威国际学术组织ACL（Association for Computational Linguistics）的首位华人主席、ACL亚太分会创始主席、ACL Fellow，还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。他还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前，王海峰在国内外期刊会议上发表的学术论文有200余篇，获得已授权专利170余项。虽然没有像百度一样公布类ChatGPT产品的发布时间表，但腾讯、阿里和华为分别提出的“混元”、“通义”和“盘古”三个大模型，均已研发了很长时间。据机器学习和自然语言处理著名学者Marek Rei教授在2022年4月发布的统计（2023年的统计尚未发布）显示，2012-2021年中，在ML（Machine Learning，机器学习）和NLP顶级期刊和会议发表论文数量最多的机构是谷歌，微软紧随其后。发文数量最多的中国机构是清华大学，第二是位列第16的腾讯，腾讯也是前32名中唯一的中国互联网厂商。不过，在2021年单年的统计中，阿里和华为也登上此榜，腾讯仍排在较靠前的位置。 Marek Rei发布的2021年ML、NLP顶会、期刊发文量统计目前，腾讯官方并没有公布“混元”大模型研发团队的具体信息。不过，腾讯旗下AI研发团队“腾讯AI Lab”的专家构成，也显示出了腾讯在AI领域的一部分实力。腾讯AI Lab由100余位AI科学家和超过300名应用工程师组成，带头人张正友博士是腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任，腾讯首位17级研究员、杰出科学家。他在美国斯坦福大学（Stanford University）发布的2022 年度“全球前2%顶尖科学家榜单”（World's Top 2% Scientists 2022）中，排名全球“终身科学影响力排行榜”第1002名，中国排名 Top 10。阿里在LLM领域的研究主要由阿里巴巴达摩院负责，阿里巴巴集团资深副总裁，阿里云智能CTO、达摩院副院长周靖人主导，他是IEEE Fellow，多次担任VLDB，SIGMOD，ICDE等国际顶级会议程序委员会主编、主席，在顶尖国际期刊和会议上发表论文超百篇，并拥有几十项技术专利。华为也未对“类ChatGPT产品”公开表态，但在大模型方面华为亦有“盘古”大模型正在研究。该项目由华为云人工智能领域首席科学家田奇博士领导，他是计算机视觉、多媒体信息检索专家，IEEE Fellow，国际欧亚科学院院士，教育部长江讲座教授，国家自然科学基金海外杰青，中国科学院海外评审专家，在国内多所高校任讲席教授及客座教授。在自己组建团队投入研发的同时，百度、阿里、腾讯、华为等IT大厂，也与中科院计算所自然语言处理研究组、哈尔滨工业大学自然语言处理研究所、中国人民大学高瓴人工智能学院等高校研究有很多的技术合作。 “集中力量办大事”的科研机构数据闭环是大模型研发的关键，用户越多，积累时间越长，就意味着可以用于迭代升级的数据和反馈也就越多。在这方面OpenAI已经利用前两代的开源GPT模型和GPT-3积累了大量数据。ChatGPT虽然才推出了3个月，但用户量和访问量增长速度飞快，这些都为OpenAI在大模型研发方面积累了巨大的先发优势。 “AI大模型如果落后了，就会面临卡脖子的风险。”很多AI专家对此都有担心，由此国内也诞生了一些应对此种局面的非营利性AI科研机构。这些机构多数有高校研究实验室背景加持，以及地方政策支持，人才聚拢能力非常强劲。北京智源人工智能研究院（以下简称“智源研究院”）是科技部和北京市政府共同支持，联合北京人工智能领域优势单位共建的非营利性创新性研发机构。智源研究院理事长张宏江，是美国国家工程院外籍院士，ACM Fellow和IEEE Fellow，同时也是微软亚洲研究院的创始人之一。 2021年，智源研究院发布了1.7万亿参数的超大模型“悟道”的1.0和2.0版本，这项工作由100余位科学家共同打造。其中包括清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）的孙茂松教授，清华大学知识工程研究室（KEG）的唐杰教授，清华大学交互式人工智能课题组（CoAI）的黄民烈教授。目前“悟道”大模型已经与OPPO、好未来、淘宝、搜狗、美团等开展了落地合作。在与美团的合作中，大模型给搜索广告带来了2.7%的收入增长。在南方的科技重镇也有一家相似的研究机构，粤港澳大湾区数字经济研究院（以下简称IDEA研究院），IDEA研究院是由深圳市政府大力支持的AI研究机构。与智源研究院有一个颇有趣的相似之处，IDEA研究院的创始人沈向洋博士同样出身微软亚洲研究院。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士，他参与创建了微软亚洲研究院，担任院长兼首席科学家，并曾担任微软公司全球执行副总裁，主管微软全球研究院和人工智能产品线，并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。 IDEA研究院NLP研究中心负责人张家兴博士也来自微软亚洲研究院，他的团队推出的开源模型“太乙”，据称在中文文生图领域可以达到接近Stable Diffusion（一款开源文生图AI模型）的水平。目前IDEA研究院正在持续迭代开发的预训练模型体系“封神榜”，已经开源了6个系列共10个模型，包含4种模型结构，模型参数最大为35亿。其中包括：以Encoder结构为主的双向语言系列模型的二郎神系列；面向医疗领域，拥有35亿参数的余元系列；与追一科技联合开发的新结构大模型周文王系列；以Decoder结构为主的单向语言模型闻仲系列；以Transformer结构为主的编解码语言模型，主要解决通用任务的大模型燃灯系列；以及主要面向各种纠错任务的比干系列。 2月20日晚，复旦大学自然语言处理实验室对媒体宣传邱锡鹏教授团队发布了“国内第一个对话式大型语言模型MOSS”，并在公开平台（https://moss.fastnlp.top/），邀请公众参与内测。然而就在外界都等着看MOSS表现如何惊艳之时。MOSS的内测网站却挂出了一则道歉公告。目前MOSS的测试网站已经挂出了停止服务的公告。一位AI大模型专家对虎嗅表示，“邱锡鹏的实验室学术研究的氛围很浓。虽然这次的MOSS很少有人得到体验机会，但是从后边的公告来看，有可能是在工程优化，并发处理等方面的准备还没有那么充分。” 在近期举行的2023年世界人工智能开发者先锋大会上，邱锡鹏教授公开表示，如果优化顺利，MOSS计划在2023年3月底开源。虽然，没能成功抢发“国产ChatGPT”，但AI业内人士对邱锡鹏教授团队仍然给出了肯定的评价，“邱锡鹏教授的团队比较偏重学术，这和早期的OpenAI在科研心态上是有共性的，非营利性的AI研究机构，没有那么多功利的考虑。” 创业公司都有“大佬”背书 AI技术属于计算机科学，虽然计算机技术已发展多年，但AI仍属于前沿科技，对LLM以及其他通用大模型的研究更是兴起不久，仍然需要依靠应用数据，持续迭代升级，不管MOSS是不是因为工程经验绊了跟头，要在AI、大模型这些领域实现突破，能推广到市场中，接地气的技术和产品才是王道。事实上，目前国内AI行业活跃的实验室大多已开始尝试商业化，在市场的磨砺中探索大模型未来的出路。深言科技深言科技源自清华大学计算机系自然语言处理与社会人文计算实验室（THUNLP）。THUNLP由清华大学人工智能研究院常务副院长孙茂松，以及刘洋、刘知远，三位教授带头。实验室在2017年推出的中文诗歌自动生成系统「九歌」则是最有影响的诗歌生成系统之一，「九歌」已经为用户创作了超过3000万首诗词。孙茂松教授领衔研发的CPM模型是智源研究院的大模型「悟道·文源」的前身，也是国内最成熟的中文生成式大模型之一。深言科技的团队也是由CPM模型的部分研发团队成员所组成的，目前该公司产品包括可以根据意思搜索词语的“WantWords反向词典”，以及根据意思查询句子的“WantQuotes据意查句”。智谱AI 智谱AI的前身是清华大学知识工程研究室（KEG），KEG专注研究网络环境下的知识工程，在知识图谱、图神经网络和认知智能领域已发表一系列国际领先的研究成果。2006年，智谱AI就启动了科技信息分析引擎ArnetMiner（以下简称AMiner）的相关研究，先后获得了国际顶级会议SIGKDD的十年最佳论文（Test-of-Time Award）、国家科学进步奖二等奖、北京市发明专利奖一等奖。 2022年8月，由KEG与智谱AI共同研发的千亿级模型参数的大规模中英文预训练语言模型GLM-130B正式发布，其在多个公开评测榜单上超过GPT-3 v1。此外，智谱AI还打造了认知大模型平台（BigModel.ai），形成AIGC产品矩阵，提供智能API服务。聆心智能 2月17日，聆心智能宣布完成由无限基金SEE Fund领投的Pre-A轮融资。聆心智能的底层技术是超拟人大规模语言模型，基于大模型可控、可配置、可信的核心技术优势，聆心智能推出“AI乌托邦”，该系统允许用户快速定制 AI 角色。聆心智能由清华大学交互式人工智能课题组（CoAI)黄民烈教授支持。CoAI是清华大学朱小燕教授及黄民烈教授领导的实验室。2020年，就已经开源了1200万对话数据和中文对话预训练模型CDial-GPT。黄民烈教授也曾参与了智源研究院的“悟道”大模型研发。西湖心辰西湖心辰背靠西湖大学深度学习实验室，创始人是西湖大学助理教授、博士生导师蓝振忠，主要研究大规模预训练模型的训练与应用。蓝振忠曾在谷歌担任研究科学家，也是轻量化大模型ALBERT的第一作者。西湖大学在人工智能领域的研发实力很强，除了蓝振忠博士的深度学习实验室，西湖大学NLP实验室，在该领域的研究也非常领先。学术带头人张岳博士在Marek Rei教授的顶会、期刊发文量统计中，于2012-2021年期间排名全球第四。 “目前国内LLM领域的创业公司相对IT大厂来说主要有两个优势，技术和数据。”西湖心辰COO俞佳对虎嗅表示，国内大模型创业公司在技术方面普遍已有多年研究经验，构筑了一定的技术壁垒，这是很难短期超越的。同时，由于已经推出了相关产品，“数据飞轮”已经转起来了，这些数据的质量相比互联网数据质量要高很多，能够对产品迭代起到很大支撑作用。对于国内大模型创业公司未来的发展趋势，俞佳认为可能性很多，“有些公司可能会走出自己的道路，也有的公司可能会像OpenAI一样与IT大厂开展深度合作，甚至像DeepMind直接并入其中。” 来源：金色财经

金色财经2023-03-03

政府数据不可信？美国私营部门数据显示劳动力市场已降温！招聘广告数量骤降

0家公司的报告。相比之下，劳工部的月度薪资调查基于122,000家企业和政府机构的报告，代表大约 666,000个个体工作场所。美国劳工部经济学家Paul Calhoun Jr.表示，美国劳工部职位空缺估计的可靠性近年来有所下降，因为回答调查问题的企业较少。该调查的回复率从2020年2月的56.4%降至去年9月的30.6%。由于回复率下降，该部门在2019年增加了样本量。相比之下，私营部门的数据并没有那么专注于主动搜索，但样本量要大得多，这为他们的数据发现提供了可信度。 ZipRecruiter首席经济学家Julia Pollak表示：“我们还没有看到就业数据放缓，但我们很快就会看到。我们也一直与客户交谈，我们与他们讨论他们未来的招聘计划。这些企业向我们透露我们，他们担心过度招聘的风险。” 位于匹兹堡的木材防腐技术公司Koppers Holdings的首席执行官Leroy Ball表示，该公司通过提高工资、改善福利和放宽招聘要求来应对劳动力短缺，但他认为这种压力有所缓解。近几个月招聘变得更加容易，营业额也有所下降。“竞争仍然很激烈，也很困难，但我们开始看到情况慢慢好转。” 美国劳工部最新数据显示，12月有1100万个职位空缺和570万失业人口，严重不匹配是工资上涨压力的来源。高盛经济学家分析私营部门数据后估计，这种不匹配可能不会那么大。高盛估计，私人数据表明职位空缺在900万到1000万之间。高盛还估计，空缺职位的减少有助于减轻近几个月的工资压力。

埃尔文2023-03-03

24小时热点