阿里甩出视频生成新王炸；苹果造车团队转岗做AI；Pika推出唇形同步功能丨AIGC大事日报_九游会官网 - J9平台

您当前所在的位置： J9九游会 > 新闻中心 > 公司新闻

新闻中心

News
分类>>

阿里甩出视频生成新王炸；苹果造车团队转岗做AI；Pika推出唇形同步功能丨AIGC大事日报

2024-10-22 22:05:54

浏览次数：次

返回列表

　　阿里甩出视频生成新王炸；苹果造车团队转岗做AI；Pika推出唇形同步功能丨AIGC大事日报今日，来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架EMO（Emote Portrait Alive），相关论文同步发表于arXiv。输入一张参考图像和声音音频，该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。

　　昨晚，AI视频生成平台Pika宣布推出为生成视频中的人物配音，并同时“对口型”的唇形同步功能LipSync，目前仅支持Pro用户体验。其中，音频生成部分由AI语音克隆创企ElevenLabs提供技术支持。

　　据彭博社援引知情人士消息报道，苹果在当地时间周二于公司内部宣布取消长达十年的电动汽车项目，从事该项目的近2000名员工中的许多人将被转到由约翰·詹南德雷亚（John Giannandrea）领导的AI部门，专注于生成式人工智能项目。

　　据electrek报道，特斯拉今日更新了移动端应用程序，推出测试版聊天助手，可以回答有关特斯拉或其他产品的问题。

　　昨日，社交平台X博主Mckay Wrigley称Gemini Pro 1.5通过视频和文本成功修复了问题代码。他将整个代码库以文本形式发送给Gemini Pro 1.5，并同时上传了摄像头拍摄的三个出错的程序界面，输入“请帮我修复代码中的所有Bug”等提示词，Gemini直接给出了问题代码位置和解决方案。

　　据Semafor今日报道，谷歌CEO桑达尔·皮查伊（Sundar Pichai）在当地时间周二晚间回应了Gemini的种族偏见争议，称该问题“不可接受”，并发誓要进行结构性调整来解决问题。他在内部信中说，公司在修复Gemini护栏方面已经取得了进展，“我们的团队一直在夜以继日地工作来解决这些问题。我们已经看到各种提示都得到了显着的改进。”

　　据非盈利新闻工作室Proof今日发布的报告，GPT-4、Llama 2、Gemini、Mixtral和Claude等领先的五个AI文本模型在26个选举相关问题上准确性表现不佳，超过一半的相应被AI专家评委不准确，40%的回答被评为有害。其中，Gemini、Llama2和Mixtral的不准确答案率最高，均超过60%。

　　据ADWEEK昨日报道，谷歌上个月为少数独立出版商推出一项计划，为后者提供未发布的生成式AI平台测试版访问权限，来换取分析和反馈。作为协议的一部分，出版商将使用该工具套件在12个月内每天发布3篇内容，每月可以获得五位数的津贴。

　　据路透社报道，Meta CEO扎克伯格周二拜访了东京，与日本首相岸田文雄讨论了AI问题。周二晚间，他抵达韩国，并于今日会见了LG电子CEO、LG母公司COO，讨论下一代XR设备开发相关业务，以及在AI领域的潜在合作。

　　据The Verge报道，OpenAI在当地时间周一提交的一份动议中称，《纽约时报》使用“欺骗性提示”让ChatGPT重复其内容，并请求纽约南部的美国地方法院驳回《纽约时报》版权侵权诉讼中的几项索赔。

　　据The Information报道，欧洲最高反垄断监管机构欧盟委员会当地时间周二称，计划审查微软对法国生成式AI初创公司Mistral的投资。微软于周一宣布与Mistral建立合作伙伴关系，向Mistral投资1630万美元，并在云平台Azure中提供Mistral的模型。

　　微软旗下的GitHub今日推出Copilot Enterprise，可根据企业内部的代码和知识库定制，每人每月39美元。

　　昨日，微软副总裁兼Copilot和必应工程与产品负责人约尔迪·里巴斯（Jordi Ribas）透露，微软正在测试Copilot GPT，当用户打开Microsoft Copilot时会出现一个新的Copilot GPT列表，可为用户提供健身训练计划、计划假期和帮助烹饪等功能。

　　据百度微信公众号今日发文，其2023年营收为1345.98亿元，净利润287亿元，同比增长39%；其第四季度营收349.51亿元，净利润77.55亿元，同比增长44%。其中，AI成为增长新动力，百度智能云、PP飞桨等AI平台高速增长，千帆大模型平台累计精调模型1万个，AI出行平台萝卜快跑第四季度提供乘车服务83.9万次。

　　据百度安全应急响应中心微信公众号今日发文，百度智能编程工具Comate及千帆大模型平台开启专项加码众测活动，活动时间为2月29日-3月12日，单个漏洞奖励最高可达3万元。

　　蚂蚁集团今日宣布推出20亿参数多模态遥感基础模型SkySense，这是蚂蚁百灵大模型在多模态领域最新的研发成果，其论文已被世界计算机视觉顶会CVPR 2024接收。数据显示，SkySense在17项测试场景中指标均超过国际同类产品，可用于地貌、农作物观测和解译等，有效辅助农业生产和经营。

　　据IT之家报道，魅族21系列手机今日获推Flyme 10.5.0.1A稳定版系统，语音助手小溪（Aicy）接入大模型，支持自然语言对话、文档总结、知识问答、出行规划、运动健康建议、文案生成等AI功能。

　　昨日，OPPO在2024年世界移动通信大会（MWC 2024）宣布将全面发力AI领域。OPPO还宣布，今年第二季度，全球OPPO Reno11系列及OPPO Find N3也将引入包括AI消除功能在内的一系列生成式AI功能。

　　昨日，学宣布将面向全体本科新生开设“人工智能通识核心课程体系”。学将建设“1+X+Y”三层次“人工智能通识核心课程体系”，以1门必修的AI通识核心课+X门AI素养课+Y门个学科与AI深度融合的前沿拓展课为基础，从知识、能力、价值观与伦理三个维度开展教育教学。

　　据404 Media今日援引内部文件报道，社交平台Tumblr和博客网站所有者正在与AI公司Midjourney和OpenAI进行谈判，以提供从用户帖子中抓取的训练数据。

　　神经拟态视觉传感公司Prophesee 2月27日宣布与高通的合作进入可量产阶段。在巴塞罗那世界移动通信大会MWC 2024期间，Prophesee展示了其解决方案与骁龙旗舰移动平台的原生兼容性，以及神经拟态视觉技术为智能手机摄像头带来的速度、能效和成像质量方面的提升。Prophesee Metavision事件视觉传感器和AI算法针对骁龙平台进行了优化，使运动模糊消除的效果和整体图像的质量都得到前所未有的提升，尤其是在快速移动和低光等传统基于帧的RGB传感器难以应对的场景中。

　　根据彭博社昨日报道，日本政府投资的半导体研发集团Rapidus将与加拿大芯片创企Tenstorrent合作设计其首款AI芯片。Tenstorrent将授权其设计日本AI加速器的一部分，并与Rapidus共同设计整个芯片。Tenstorrent成立于2016年，首席执行官为芯片界大神吉姆·凯勒（Jim Keller）。Rapidus成立于2022年，计划在2027年开始芯片生产AG九游会登录J9入口，与台积电和三星电子等公司竞争。

　　据TechCrunch昨日报道，法国AI图像编辑器创企Photoroom近期以5亿美元估值完成了4300万美元融资，Balderton Capital领投此轮融资，新投资者Aglaé和之前的投资者Y Combinator参投。Photoroom目前拥有约50名员工，计划利用这笔融资雇用更多员工，并投资于研发和基础设施。

上一篇：J9九游会中新网黑龙江新闻官方微信：扫一扫立即关注！

下一篇：人民日报人民论坛：体育的意蕴在健康