FX168财经网_全球视野外汇黄金加密货币NFT资讯网

Auki Labs CEO：DePIN将解决AI最大痛点

助复杂的三角测量，Skyhook 和 Google 等公司已经成功创建了低分辨率地图，显示世界上许多 WiFi 路由器的位置。这就是为什么 Google 地图等导航应用程序会要求您打开 WiFi 以获得更好的结果。在过去的十年中，批评者提出了许多与 WiFi 三角测量相关的隐私问题和诉讼。公平地说，不幸的是，隐私输掉了这场战斗。或许，令人安慰的是，WiFi 三角测量仍然只能帮助普通用户将自己定位在几米之内——这不足以让我们的取番茄酱的机器人正确地理解它所在的过道。因此，大型科技公司已经转向地理定位领域下一个有希望的进步：视觉定位系统。在 Niantic 和 Snap 等公司的带领下，视觉定位系统 (VPS) 将机载摄像头看到的世界与存储在中央控制云中的外部存储器中的世界进行比较。简而言之，VPS 是一种交易，您可以告诉大型科技公司您正在寻找什么，以便他们可以知道您在哪里。视觉定位系统在理想情况下精确到厘米，在许多城市公共空间中精确到一米以下。正是由于这种无与伦比的精度，大型科技公司才将赌注押在 VPS 上，以实现机器人和 AR 眼镜的未来。但这应该让我们停下来。还记得过去移动社交媒体时代的许多隐私侵犯行为吗？当大型科技公司可以通过我们的眼睛看到世界，通过我们的机器伴侣看到我们的家庭和私人空间时，我们将如何应对？企业也需要隐私如果您走进一家杂货店并开始拍摄货架，您很快就会发现自己被护送出商店。放置在视线高度的产品更有可能被拿起和购买，零售商会仔细考虑如何放置产品以最大限度地提高销量。因此，商店的视觉营销布局是严格保守的竞争秘密。简而言之，商店无意与中央服务共享其商店的产品布局。期望我们的机器人能够简单地出现在商店并立即知道每件产品在哪里是不合理的，因为这会损害商店的知识产权。相反，我们所能期望的最好结果是，商店拥有自己的自托管安全系统，可以回答机器人有关个别产品的问题，并引导人工智能和增强现实眼镜到达它们需要去的地方，而不会损害公司的安全。细心的读者已经发现 DePIN 有望在哪些方面超越 Web2 时代的巨头，并以保护隐私的方式为我们提供番茄酱。与人类不同，机器人和计算机可以相互交换空间数据，共同感知世界。协作空间计算将允许机器通过连接到其他外部信息源来更好地导航世界。在 Web3 DePIN 范式中，这种交换既可以得到经济激励，又可以得到加密安全。去中心化机器感知网络想象一下我们的杂货购物机器人可以更快地找到番茄酱而不损害公司安全，这是一个可爱的例子。但去中心化的机器感知的影响是惊人的。一旦自动驾驶汽车能够相互协调并交换实时交通信息，交通将会发生根本性的转变。在北京，路上的汽车数量比洛杉矶的人口还多。分散的机器感知将使这些汽车能够相互协调地更快地移动，从而释放数百年的日常生产力。去中心化的机器感知有一天将允许具有更小外形尺寸的隐私保护 AR 眼镜，因为眼镜可以将一些繁重的空间计算下载到本地定位服务器，并以与书写或计算机的发明一样深远的方式改变人类交流。随着我们的文明在未来 20 年发展到超过 1000 亿智能决策者，去中心化的机器感知网络将帮助他们中的每一个人找到自己在世界上的位置，无论是在地球上还是在其他地方。来源：金色财经

金色财经05-16 11:37

每日重要事件点评：5月16日

传媒：传媒ETF（SZ159805） Google召开2024年I/O大会，公司对旗下的多款AI产品进行了更新，如大模型Gemini、Astra、Veo、Imagen3等。化工：化工ETF（SZ159870）工业级磷铵多停报停签，由于下游拿货积极，导致供应端货源紧缺，目前主流企业主发预收。市场点评：昨日市场整体调整，港股休市缺少外资流入，两市成交额也萎缩至7600亿。除地产链收到相应事件刺激有所上涨外，其余板块呈现普跌。有机构认为，近期业绩因子持续保持强势，且外资集中回流，预计短期风格偏好高质量龙头。数据来源：财联社，数据截至日期：2024年5月16日基金有风险，投资需谨慎以上内容与数据，与界面有连云频道立场无关，不构成投资建议。据此操作，风险自担。

有连云05-16 09:47

痛失“ChatGPT之父”！IIya与OpenAI分道扬镳，保守派的大溃败？

15年离开谷歌人工智能研究部门之一的 Google Brain ；同年，和奥特曼、马斯克等人共同创立了OpenAI 。长期以来，这家初创公司一直处于人工智能研究的最前沿。在2022 年底，OpenAI发布 ChatGPT 一举惊艳世界，此后 OpenAI 便成了炙手可热的“当红炸子鸡”。去年11月，OpenAI一场魔幻“宫斗大戏”上演，举世震惊。 Ilya出于对公司大模型安全性的忧虑，曾联合董事会成员发起了罢免奥特曼的行动。不过，在遭到“排山倒海”般的强烈反对后，仅仅五天后，董事会又把奥特曼请了回来。对此，Ilya当时表示，对“参与董事会行动”表示遗憾。在奥特曼重新回归的几个月后，OpenAI董事会人数扩大到七人，奥尔特曼重新获得了董事会席位。自此后，Ilya 虽仍然是 OpenAI 的员工，但再也没有出现在大众的视线。这也一度引发人们猜测：Ilya或许可能已经离开了OpenAI。现在，一切已经成真。那么在离开OpenAI后，Ilya会有什么新动作？据本人透露，他正在启动一个新项目，不过没有详细说明。 “我很期待接下来的计划——这个项目对我个人来说意义重大，我会在适当的时候分享细节。” 事实上，一路过来，AI圈里“斗来都去”都是同一批人。许多从OpenAI出来的研究员，

格隆汇05-15 16:44

大利好！Google奋力追赶劲敌向台积电抛出橄榄枝！

投资慧眼Insights - 据报道，Google计划在明年的Pixel 10系列中放弃三星，转而采用台积电(TSM.US)的3纳米技术生产客制化系统单晶片（SoC），这意味着台积电的影响力正持续扩大。为了实现这一转变，Google已经扩大了台湾研发中心，并加强与台积电的合作。今年，Google(GOOG.US)将推出Pixel 9系列，搭载新一代处理器Tensor G4，但明年计划改用台积电技术取代三星，以提高产品性能竞争力。与此同时，Google的竞争对手高通和联发科将推出采用台积电N3E制程的处理器Snapdragon 8 Gen 4和Dimensity 9400，这是第二代3纳米制程，这意味着Google产品在技术上落后一代。市场关注Google在技术发展方面的进展，可能会提前采用台积电N3E技术。 Google与台积电的合作将进一步刺激3纳米芯片的出货量。根据台积电第一季财报显示，3纳米芯片出货量占销售额的9%，市场预计这一比例有望达到20%。截至发稿，台积电美股盘后涨0.69%，报152.81美元。

投资慧眼05-15 15:10

句句不离AI ，谷歌自我革命！Gemini 家族大上新，AI 超级全家桶“杀疯了”

以及全新的Project Astra、Google Veo、magen 3等模型。 AI搜索引擎“AI Overviews” 谷歌正式推出“AI Overviews”搜索体验。据介绍，AI Overviews搜素引擎具备多步骤推理能力以及计划能力。此外，靠Gemini的多模态功能，谷歌可以做到利用声音搜歌曲，利用图片搜产品。 Gemini 1.5 Pro 更新 Gemini 1.5 Pro上下文窗口扩展支持200万token，号称“迄今为止所有基础模型中最长的上下文窗口”。谷歌还通过数据和算法的改进增强了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力。对于复杂指令，可遵循更复杂的指令，控制回复风格，设置系统指令。谷歌称，今年夏季将扩展 Gemini 的多模态功能，包括增加用语音进行深入双向对话的能力，这一功能被称之为 Gemini Live。目前，有超过 150 万的开发人员在使用 Gemini 模型，超过 20 亿的产品用户都用到了 Gemini。新成员：Gemini 1.5 Flash 模型 Gemini 1.5 Flash，是谷歌追求速度和效率的轻量级模型，也是 Gemini 模型系列的最新成员。它针对大规模、大批量、高频任务进行了优化，服务更具成本效益，并具有突破性的长上下文窗口（100 万 token ）。在应用场景上，它擅长总结、聊天、图像视频字幕、长文档数据提取等任务。Gemini 1.5 Flash通过从1.5 Pro模型中学习，继承了其核心能力。 AI助手：Project Astra 新的多模态AI项目Project Astra，是谷歌人工智能助手的最新进展。在演示中，AI助手可以通过视频和音频识别。例如，帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。谷歌表示，一个真正有用的聊天机器人需要让用户“自然地与它交谈，没有滞后或延迟”。皮查伊预计 Project Astra 将于今年晚些时候在 Gemini 启动。新一代开源大模型 Gemma 2 谷歌开源大模型——Gemma 2 也来了。据介绍，Gemma 2 采用全新架构，旨在实现突破性的性能和效率，新开源的模型参数为 27B。视频大模型Google Veo、文生图像模型 Imagen 3 谷歌还发布了用于生成高清视频的最新模型“Veo”，以及最高质量的文本到图像模型 Imagen 3。据悉，Veo 能够生成各种风格的高质量 1080p 分辨率视频，时长可以超过一分钟。它可以凭借对自然语言和视觉语义的深入理解，并在理解视频内容、渲染高清图像、模拟物理原理等方面都有所突破。 Imagen 3则在生成细节、光照、干扰等方面进行了优化升级，并且理解 prompt 的能力显著增强。 AI手机系统：Android 15操作系统在 I/O 大会上，谷歌提到了即将推出的安卓新版本，即以 AI 为核心的 Android 15。谷歌还宣布对其适用于 Android 设备的 Gemini AI 聊天机器人进行一些改进：Gemini 正在“成为 Android 上新的人工智能助手”。这也意味着大模型现已成为 Android 操作系统的一部分，使其能够以更全面的方式集成。 AI芯片：第六代TPU芯片Trillium 谷歌第六代TPU芯片Trillium，是迄今为止性能最强大、能效最高的 TPU，将于 2024 年底正式上线。与 TPU v5e 相比，Trillium TPU 的每芯片峰值计算性能提高了 4.7 倍，同时它还把高带宽内存（HBM）以及芯片间互连（ICI）带宽加倍。皮查伊表示，将于 2024 年底正式上线。 “25 年来，我们投资建设了世界一流的技术基础设施。从支持搜索的尖端硬件，到支持人工智能进步的定制张量处理单元。我们将于 2024 年末向我们的云客户提供 Trillium。” 最后从模型到应用，再到芯片……此次谷歌年度 I/O 开发者大会让人应接不暇。顶着Open AI压力的谷歌，这一次正面硬刚的表现还是非常出色的。此前一天，OpenAI抢先一步发布了GPT-4 型号的最新版本——GPT-4o，似乎是有意狙击谷歌一般。 GPT-4o不仅在听、说、看方面更“丝滑”，并且将向所有用户免费开放。这也让市场为谷歌的“大上新”捏了一把汗。但从现在来看，随着全家桶AI能力升级，谷歌靠着多维度反击，这一战双方势均力敌。因为从创新方向来看，OpenAI注重AI技术的突破和飞跃，谷歌则注重生态系统的深化与整合，二者均各有所长。当下，人工智能战场上的“厮杀”激烈。在这场科技巨头的较量中，谷歌与OpenAI的再次交锋，也势必将人工智能的创新推向高潮。各方科技巨头不停革新着自家的“大杀器”，也预示着AI的新一轮变革。而谷歌和Open AI的对决，远未止步于此。

格隆汇05-15 11:24

谷歌“开大”对垒GPT-4o，桥水大手笔增持科技巨头，纳指创历史新高！纳斯达克100ETF（159659）跳空上行

-4o】当地时间5月24日周二，年度Google I/O开发者大会上，谷歌CEOSundar Pichai发布了一系列与AI有关的新品和新功能，包括：AI Overviews技术生成摘要功能、Gemini 1.5 Pro上下文窗口拓宽至200万Tokens、多模态Gemini Nano模型、第六代TPU芯片Trillium等。围绕AI搜索引擎方面，谷歌带来了一系列更新。值得一提的是，谷歌发布了一款多模态AI项目Astra，用来处理音频、视频等多模态的输入内容。从OpenAI和谷歌的发布会来看，GPT-4o目前只能处理静止图像，但Astra可以处理视频，这是一个显著的优势。此外，谷歌在发布会上还对Gemini 1.5 Pro大模型进行了诸多更新，使其可以拥有更自然的声音、更长的对话、对音频和图像的更好理解、更多的逻辑推理和规划能力，以及更好的代码生成。媒体指出，就当前进展而言，很难判断OpenAI和谷歌的AI助手中谁更胜一筹，但二者对该领域的重视程度是无疑的。【桥水基金一季度大手笔增持科技巨头】根据美国证券交易委员会(SEC)披露，全球最大规模对冲基金桥水基金递交了截至2024年3月31日的第一季度持仓报告(13F)。统计数据显示，桥水基金第一季度持仓总市值达179亿美元，上一季度总市值为165亿美元，环比增长8.48%。前十大重仓股分别为：iShares标普500指数ETF，新兴市场coreETF，谷歌，宝洁，英伟达，Meta、强生、沃尔玛、好市多以及可口可乐。从持仓比例变化来看，前五大买入标的分别是：谷歌、英伟达、苹果、Meta Platforms以及亚马逊。自去年第一季度以来，桥水基金一直在增持科技股。当季，该基金的前五大买入标的均为科技巨头。其中亚马逊是一季度桥水最大的新建仓个股，买入近105万股，价值1.89亿美元。第二大新晋建仓做多的个股是芯片制造商AMD，买入近68万股，价值1.23亿美元。值得一提的是，桥水还大手笔增持苹果184.1045万股，至总持仓为184.2154万股、价值3.16亿美元，等于去年末仅持有1109股。桥水在向SEC提交的文件中还提到，伴随着计算技术、数据分析和相关领域的发展，组合管理、交易、组合风险管理和其他投资流程方面越来越倾向于使用生成式人工智能、大语言模型、机器学习、人工神经网络等工具。【助力拥抱AI浪潮——纳斯达克100ETF（159659）】纳斯达克100ETF（159659）被动跟踪纳斯达克100指数。纳斯达克100指数以纳斯达克指数为基础并加以精华提炼，选取其中100家非金融公司作为成分股，在市值加权的基础上按相应的指数编制规则计算出来的、反映纳斯达克整体市场或者美国高科技走势的指数。在人工智能的时代浪潮之下，在AI领域有着领先布局和深厚积淀的科技巨头集中在纳斯达克100指数，前十大权重占比达46.56%，龙头属性集中。来源：纳斯达克，截至2024.4.30。 2010年以来，纳斯达克100指数累计涨幅876.24%，显著跑赢纳斯达克综合指数、标普500等美股主要指数，同时大幅跑赢英国富时100、德国DAX、法国CAC40等全球其他主要市场核心指数。来源：Wind，统计区间2010.1.1-2024.5.10。纳斯达克100指数发布于1985年2月1日，指数过往业绩不代表未来表现。综合来看，纳斯达克100ETF（159659）不失为布局大型科技股的便捷工具，场外用户可通过联接基金（A类019547；C类019548）进行定投、申购。风险提示：基金有风险，投资须谨慎。上述观点、看法和思路根据截至当前情况判断做出，今后可能发生改变。对于以上引自证券公司等外部机构的观点或信息，不对该等观点和信息的真实性、完整性和准确性做任何实质性的保证或承诺。纳斯达克100ETF可以投资境外市场。本基金除了需要承担与境内证券投资基金类似的市场波动风险等一般投资风险之外，还面临因投资境外市场所带来的汇率风险等特有风险。基金过往业绩不代表其未来表现，基金管理人管理的其他基金的业绩并不构成本基金业绩表现的保证。投资者应认真阅读《基金合同》《招募说明书》《产品资料概要》等基金法律文件，全面认识基金产品的风险收益特征，在了解产品情况及听取销售机构适当性意见的基础上，根据自身的风险承受能力、投资期限和投资目标，对基金投资做出独立决策，选择合适的基金产品。纳斯达克100指数近五年表现分别为37.96%(2019)、47.58%(2020)、26.63%(2021)、-32.97%(2022)、53.81%(2023)。纳斯达克100指数由纳斯达克股票市场公司编制和发布。指数编制方将采取一切必要措施以确保指数的准确性，但不对此作任何保证，亦不因指数的任何错误对任何人负责。指数过往业绩不代表其未来表现，亦不构成基金投资收益的保证或任何投资建议。

金融界05-15 09:50

AI视频大对决！谷歌震撼推出视频生成模型Veo！能否超越OpenAI的Sora？

比斯（Demis Hassabis）在Google I/O 大会正式宣布推出了文本生成视频模型Veo，用户可以使用文本、图像或视频等素材来指导Veo生成自己想要的视频作品。 Veo的推出旨在于于为用户提供更高品质、多风格的影片生成体验，因此该模型被视为是OpenAI推出的AI生成视频模型Sora的竞争对手。对于该AI模型的竞争优势，谷歌高管声称，Veo 能理解“延时拍摄”、“航拍风景”等视觉效果，可以生成各种电影和视觉风格的 1080p 分辨率视频，时间还可以超过一分钟。

投资慧眼05-15 09:30

谷歌推出史上最强大AI模型Gemini，挑战OpenAI旗舰模型GPT-4o

在年度Google I/O开发者大会上，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新。此举标志着谷歌在人工智能领域的又一重要突破，同时也是对OpenAI新发布的旗舰模型GPT-4o的有力回应。 Pichai表示，谷歌的全部工作重心都已转向Gemini，他们希望通过这个强大的AI模型，让每个人都能从中受益。为了实现这一目标，谷歌率先将AI技术应用于搜索领域，推出了全新的AI搜索功能。在美国，AI生成摘要的功能——AI Overviews，已率先上线谷歌搜索，并计划在全球范围内推广。该功能利用Gemini的多步推理能力，能够代替用户进行研究，提供更精准的搜索结果。例如，通过汇总用户一整天的膳食和食谱，Gemini可以帮助规划饮食，甚至推荐购买所需餐食的地方。此外，借助Gemini的力量，谷歌搜索的结果页面也将发生变革。用户可以获取更加个性化的推荐，如寻找有现场音乐的餐厅时，Gemini可以根据季节等因素提供智能推荐。在谷歌相册Google Photos中，Gemini同样展示了其强大的搜索能力。新推出的Ask Photos with Gemini功能允许用户通过上下文搜索找到特定的照片，如车牌照号等。同时，谷歌的云计算生产力和协作平台Google Workspace也将与Gemini紧密结合，提升工作效率。值得一提的是，Gemini还可用于搜索手机内容，如查找收据或安排取货时间等。对于计划旅行的用户来说，Gemini还能搜索有趣的活动，使旅行更加丰富多彩。在AI模型的更新方面，谷歌推出了Gemini 1.5 Pro，拥有全球消费类聊天机器人中最长的上下文窗口，起始窗口就高达100万个token。此外，新模型还支持超过35种语言，并向150多个国家和地区的Gemini Advanced订阅者提供。除了文本交互外，谷歌还计划在今年夏季扩展Gemini的多模态功能，包括增加语音进行深入双向对话的能力。这一功能被称为Live，它将使用户能够与Gemini进行更自然的交流。与此同时，谷歌还宣布了将在Gemini Advanced中添加新的旅行规划功能和数据分析功能。这些新功能将进一步提升Gemini的实用性，使其能够更好地满足用户的个性化需求。此外，谷歌还推出了名为Gem的Gemini定制版本。用户可以根据自己的需要创建个性化的Gemini，如健身伙伴、主厨帮手等。这将为用户带来更加个性化的AI体验。在移动端方面，谷歌推出了新的多模态AI项目Project Astra，它可以为用户解释智能手机拍到的东西。同时，谷歌还计划为安卓端侧的Gemini增加多模态功能，使手机能够通过多种方式理解世界。总的来说，谷歌通过这一系列更新和升级，进一步巩固了其在搜索和AI领域的领先地位。同时，这些创新举措也展示了谷歌对未来科技的深刻洞察和坚定投入。

金融界05-15 08:03

Google I/O 2024：开启新一代的 I/O

过调整以包含更多在舞台上宣布的内容。 Google 已全面进入 Gemini 时代。在深入探讨之前，我想先回顾一下我们所处的时刻。十多年来，我们一直在 AI 领域进行投入，并在各个层面进行创新：研究、产品、基础设施，今天我们将对此进行全面讨论。尽管如此，我们仍处于 AI 平台转型的初期。我们看到了为创作者、开发者、初创公司以及每一个人所带来的巨大机遇。帮助推动这些机遇正是我们 Gemini 时代的意义所在。让我们开始吧。 Gemini 时代一年前，在 I/O 大会上，我们首次分享了 Gemini 的计划：一个从一开始就构建为原生多模态的前沿模型，能够跨文本、图像、视频、代码等多种数据类型进行推理。它标志着将任意输入转换成任意输出的重要一步——新一代的“I/O”。自那以来，我们推出了首批 Gemini 模型，这是我们迄今为止功能最强大的模型。它们在每个多模态基准测试中都拥有卓越的表现。两个月后，我们又推出了 Gemini 1.5 Pro，它在处理长上下文方面取得了重大突破，能够稳定地在生产环境中运行 100 万个令牌（Token），比目前任何其他大规模基础模型都要多。我们希望每个人都能从 Gemini 的功能中受益。因此，我们立即行动起来，与大家分享这些进展。目前，超过 150 万的开发者在使用我们各种工具中的 Gemini 模型。你们使用它来调试代码、获得新的见解并打造下一代的 AI 应用。我们也在不断将 Gemini 的突破性功能以强大的方式整合到我们的产品中。今天，我们将展示搜索、Photos、Workspace 和 Android 等产品中的实例。产品进展今天，我们所有拥有 20 亿用户的产品都在使用 Gemini。我们还推出了全新的体验，包括在移动设备上，人们现在可以通过 Android 和 iOS 上的应用程序直接与 Gemini 互动， Gemini Advanced让用户还可以使用我们功能最强的模型。仅在三个月的时间里，已有超过一百万人注册试用，并且势头依然强劲。在搜索中扩展 AI Overviews Gemini 带来的最令人兴奋的变革之一是在 Google 搜索中。在过去的一年中，作为我们生成式搜索体验（Search Generative Experience）的一部分，我们已经回答了数十亿个搜索查询。人们正在以全新的方式使用搜索，提出全新类型的问题，作出更长、更复杂的查询，甚至是通过照片进行搜索，并获得网络上的最佳信息。我们一直在 Labs 之外对这种体验进行测试。我们倍受鼓舞地看到，不仅搜索的使用量有所增加，用户满意度也得到了提升。我很高兴宣布，我们将于本周在美国向所有用户推出这一全新改版的 AI Overviews 体验。我们很快也将把这项体验推广到更多国家。在搜索领域正发生着诸多创新。得益于 Gemini，我们能够打造更为强大的搜索体验，包括在我们的产品之中。介绍 Ask Photos Google Photos 就是一个例子，在大约九年前，我们发布了这款产品，自那以来，人们一直用它来整理最珍贵的回忆。如今，每天上传的照片和视频数量超过 60 亿。人们喜欢使用 Photos 来搜索他们生活中的点滴。借助 Gemini，我们让这一切变得更加简单。假设你在停车场缴费时，却想不起自己的车牌号。以往，你需要在 Photos 中搜索关键词，然后翻找多年积累的照片来寻找车牌。但现在，你只需直接询问 Photos 即可。它能够识别出经常出现的车辆，通过多方信息交叉验证判断出哪一辆是你的，并提供车牌号码。 Ask Photos 还能够帮助你以更深入的方式重温回忆。例如，你可能正在回味女儿 Lucia 成长的早期重要时刻。现在，你可以直接问 Photos：“Lucia 是什么时候学会游泳的？” 你甚至可以跟进提出更复杂的问题：“向我展示 Lucia 的游泳技能是怎么进步的。” 在这里，Gemini 不再只是进行简单的搜索，它会识别不同的上下文——从在游泳池中扑腾，到在海洋中浮潜，再到她游泳证书上的文字和日期。Photos 会将所有这些信息整合在一起形成一个总结，让你能够全面了解，并再次重温那些美妙的回忆。我们将在今年夏天推出 Ask Photos，并将持续增加更多功能。通过多模态和长上下文解锁更多知识为了理解跨越不同格式的各种知识，我们从一开始就将Gemini 打造成多模态的。它是一个内置了所有模态的模型。因此，它可以理解不同类型的输入，并找到它们之间的联系。多模态从根本上扩展了我们可以提出的问题以及我们将得到的答案。而长文本能力则使其更进一步，让我们能够引入更多信息：数百页文本、数小时音频或一小时的视频、整个代码存储库……或者，如果你愿意，大约 96 份芝士蛋糕工厂餐厅的菜单。处理这么大量的菜单，你可能需要 100 万令牌的上下文窗口，而现在通过 Gemini 1.5 Pro 就可以实现。开发者们就一直在以各种非常有趣的方式使用它。在过去的几个月里，我们已经推出了具有长上下文能力的 Gemini 1.5 Pro的预览版，我们还对翻译、编码和推理的质量进行了一系列改进。从今天开始，你也将在模型中看到这些更新。现在我很高兴地宣布，我们将向全球所有开发者推出改进版的 Gemini 1.5 Pro。此外，从今天开始，具有100 万令牌上下文能力的 Gemini 1.5 Pro 也可供 Gemini Advanced 的消费者直接使用，包含 35 种语言。在非公开预览版中扩展到 200 万令牌 100 万令牌正在开辟全新的可能性。这已经很振奋人心，但我认为我们还可以更进一步。今天，我们将上下文窗口扩展到 200 万个令牌，并将其以非公开预览版的方式提供给开发者们。过去几个月来我们所取得的进展让我非常激动，这代表着我们朝无限上下文的最终目标又迈出了一步。将 Gemini 1.5 Pro 应用于 Workspace 到目前为止，我们已经分享了两项技术进步：多模态和长上下文。他们各自已经非常强大，但二者结合能够释放更深层次的能力和更多的智能。这在 Google Workspace 中体现得更加淋漓尽致。长期以来，人们总在 Gmail 中搜索他们的电子邮件。而现在我们正通过 Gemini 使其变得更加强大。例如，作为家长，你希望随时了解孩子在学校发生的一切，Gemini 就可以帮助你！现在，我们可以让 Gemini 总结学校最近发来的所有电子邮件。在后台，它可以识别相关电子邮件，甚至分析 PDF 等附件，你可以获得一份包含关键要点和待办事项的摘要。也许你本周正在旅途中，无法参加家长会议，而会议录音长达一个小时。如果这份录音来自于 Google Meet，你就可以让 Gemini 为你提供重点内容。倘若有个家长小组正在寻找志愿者，而你那天正好有空，那么当然，Gemini 还可以帮助你起草回复邮件。还有无数其他例子可以说明 Gemini 如何让生活更轻松。今天起 Gemini 1.5 Pro 已经应用在 Workspace Labs 中。 NotebookLM 中的音频输出我们刚刚看了一个文本输出的例子，但通过多模态模型，我们可以做得更多。我们在这方面已经取得了进展，未来还会有更多。NotebookLM 中的音频概述（Audio Overview）就显示了在这方面的进展：它通过 Gemini 1.5 Pro，可以基于你的源文件生成个性化和交互式音频对话。这就是多模态带来的可能性，很快你就能够将输入和输出进行混合和匹配，这就是我们所说的新一代 I/O的意思。但如果我们还能再进一步呢？使用 AI 智能体更进一步在这一方面更进一步就是我们在 AI 智能体（AI Agents）上看到的机遇之一。我认为它们是可以推理、规划和记忆的智能系统。它们能够提前多步”思考”，跨软件和系统工作，所有这些都是为了帮助你完成任务，而最重要的是要在你的监督之下。我们仍处于早期阶段，但让我向你展示一些我们正在努力解决的应用案例的类型。让我们以购物为例。买鞋很有意思，但当鞋子不合适需要退货时就不那么有趣了。想象一下，如果 Gemini 可以为你完成所有步骤：在你的收件箱中搜索收据…… 从你的电子邮件中找到订单号…… 填写退货表格…… 甚至安排 UPS 取件。那是不是容易多了？让我们再举一个更复杂一些的例子。假设你刚搬到芝加哥。想象一下 Gemini 和 Chrome 能够共同协作帮助你做很多准备工作——代替你组织、推理、综合分析等。比如，你想要探索这座城市并找到附近的服务——从干洗店到遛狗服务，你还必须在数十个网站上更新你的新地址。现在 Gemini 可以胜任这些工作，并在需要时提示你提供更多信息。这样事情始终在你的掌控之中。这部分非常重要——当我们做这些体验的原型设计时，我们深思熟虑如何以一种私密、安全且对每个人都适用的方式来进行。这些都是简单的应用案例，但它们可以让你很好地了解到，通过构建能够代表你去提前思考、推理和计划的智能系统，我们希望能够解决的问题类型。这对我们的使命意味着什么 Gemini 凭借其多模态、长上下文和智能体，使我们更接近我们的最终目标：让 AI 助力每个人。我们认为，这是我们在达成使命方面取得最大进展的方式：整合以各种方式输入的全球信息，使其可以通过任何输出方式被获取，并将全球信息与你的世界中的信息结合起来，以一种真正对你有用的方式进行呈现。新的突破为了充分发挥 AI 的潜力，我们需要开创新领域，谷歌 DeepMind 团队一直致力于此。我们已经收到了大家对 1.5 Pro 及其长上下文窗口的热情反馈，但我们也从开发人员那里了解到，他们想要更快、更具成本效益。因此，明天，我们将推出 Gemini 1.5 Flash，一个为规模化构建的更轻量级的模型，它针对以低延迟和成本为重的任务进行了优化。1.5 Flash 将于周二在 AI Studio 和 Vertex AI 中提供。展望未来，我们始终希望构建一个在日常生活中有用的通用智能体。Astra 项目展示了多模态理解和实时对话能力。我们还在视频和图像生成方面取得了进展，推出了 Veo 和 Imagen 3，并推出了 Gemma 2.0——我们为负责任的 AI 创新打造的下一代开放模型。 AI 时代的基础设施：介绍 Trillium 训练最先进的模型需要大量的计算能力。过去六年中，行业对机器学习计算能力的需求增长了 100 万倍。而且，每年都会以十倍的速度增长。 Google 在这方面具有优势。25 年来，我们一直在投资世界一流的技术基础设施，从支持搜索的尖端硬件，到为我们的 AI 进步提供支持的定制张量处理单元（tensor processing units）。 Gemini 完全在我们的第四代和第五代 TPU 上进行训练和服务。包括 Anthropic 在内的其他领先的 AI 公司也已经在 TPU 上训练了他们的模型。今天，我们很高兴地宣布推出第六代 TPU—— Trillium。Trillium 是我们迄今为止性能最强、效率最高的 TPU，与上一代 TPU v5e 相比，每个芯片的计算性能提高了 4.7 倍。我们将在 2024 年底向 Cloud 客户提供 Trillium。除了我们的 TPU，我们还推出 CPU 和 GPU 来支持任何工作负载。这包括我们上个月宣布的新型 Axion 处理器，我们的首款基于 Arm 定制的 CPU，可提供业界领先的性能和能效。我们也很自豪成为首批提供Nvidia(913.56，9.57，1.06%)尖端 Blackwell GPU 的 Cloud 提供商之一，该 GPU 将于 2025 年初上市。我们很幸运能与 NVIDIA 建立长期合作伙伴关系，并很高兴能将 Blackwell 的突破性功能带给我们的客户。芯片是我们集成端到端系统的基础部分，从性能优化的硬件和开放软件到灵活的消费模式。所有这些都汇集在我们的 AI 超级计算机（ AI Hypercomputer）中，这是一种开创性的超级计算机架构。企业和开发者正在使用它来应对更复杂的挑战，其效率是仅购买原始硬件和芯片的两倍多。我们的 AI 超级计算机的进步之所以成为可能，是因为我们在数据中心采用了液体冷却的方法。我们已经这样做近10年了，远早于它成为行业的先进技术。如今，我们部署的液体冷却系统总容量已接近 1 吉瓦，并且还在不断增长——这几乎是任何其他团队的 70 倍。这背后的基础是我们庞大的网络规模，它连接了我们全球的基础设施。我们的网络覆盖了超过 200 万英里的陆地和海底光纤：是紧随之后的云服务提供商的 10 倍（！）以上。我们将继续进行必要的投资，以推进 AI 创新并提供最先进的功能。搜索最激动人心的篇章我们最大的投资和创新领域之一是我们的创始产品——搜索。25 年前，我们创建了搜索，以帮助人们理解互联网上汹涌的信息浪潮。随着每一次平台的转变，我们都在帮助更好地回答你的问题上取得了突破。在移动设备上，我们利用更好的上下文、位置感知和实时信息，解锁了新型的问题和答案。随着自然语言理解和计算机视觉技术的进步，我们实现了新的搜索方式，可以用语音或哼唱来找到你最喜欢的新歌；或者用你在散步时看到的那朵花的图像来进行搜索。现在，你甚至可以使用 Circle to Search 来搜索你可能想要购买的那些很酷的新鞋。去试试吧，反正你总能退货！当然，Gemini 时代的搜索将把这一切提升到一个全新的水平，它将把我们的基础设施优势、最新的 AI 功能、对信息质量的高标准以及数十年来把你与丰富的网络连接起来的经验相结合。其结果将是一款为你工作的产品。 Google 搜索是生成式 AI，其规模足以满足人类好奇心。这是我们迄今为止最激动人心的搜索篇章。更智能的 Gemini 体验 Gemini 不仅仅是一个聊天机器人；它旨在成为你得力的私人助手，可以帮助你处理复杂的任务并代表你采取行动。与 Gemini 的互动应该是对话式的、直观的。因此，我们宣布推出称为 Live 的全新 Gemini 体验，让你可以使用语音与 Gemini 进行深入对话。我们还会在今年晚些时候将 Gemini Advanced 提升为 200 万个令牌，以便能够上传和分析视频和长代码等超密集文件。 Android 上的 Gemini 全球有数十亿 Android 用户，因此我们很高兴能将 Gemini 更深入地融入用户体验。作为你的全新 AI 助手，Gemini 可随时随地为你提供帮助。我们已将 Gemini 模型整合到 Android 中，包括我们最新的设备端模型：Gemini Nano 多模态模型（Gemini Nano with Multimodality），它可以处理文本、图像、音频和语音，在保证存储在设备上的信息私密性的同时解锁新的体验。我们负责任的 AI 方法我们继续大胆而振奋地把握住 AI 所带来的机遇。同时，我们也在确保以负责任的方法行事。我们正在开发一种叫做 AI 辅助红队测试（AI-assisted red teaming）的尖端技术，该技术利用了 Google DeepMind 在 AlphaGo 等游戏方面的突破以改进我们的模型。此外，我们也已将 SynthID 水印工具扩展到文本和视频两种新的模态，因此更容易识别 AI 生成的内容。共同创造未来所有这些都表明了我们在以大胆而负责任的方法，让 AI 助力每个人方面取得的重要进展。很长一段时间以来，我们一直采用 AI 为先的方法。我们数十年的研究领导者地位开创了许多现代突破，为我们和整个行业的 AI 进步提供了动力。最重要的是，我们拥有：专为 AI 时代打造的世界领先基础设施现在由 Gemini 提供支持的搜索领域的尖端创新在极大规模上提供帮助的产品——包括 15 款拥有 5 亿用户的产品让每个人——合作伙伴、客户、创作者以及所有人——都能创造未来的平台。这一进步之所以能够实现，是因为我们卓越的开发者社区。通过每天创建的体验和应用程序，你们将这一切变为现实。在此，我要向在 Shoreline 现场的各位以及全球数百万在线观看的朋友们致意：让我们共同迎接未来的无限可能，携手共创美好未来。

金融界05-15 08:02

谷歌为加拿大安卓用户推出紧急定位服务，缩短救援响应时间，关键时刻可救命！

news.ca/2024/05/13/google-launches-emergency-location-service-in-canada-for-android-users/ 作者：在溪

超级爆料君05-15 05:00

24小时热点