2025年6月2日,AI视频工具更新频繁:Veo 3、微软与OpenAI合作的Sora免费工具及Freepik的FLUX Kontext和Kling 2.1纷纷上线,推动视频创作门槛下降与效率提升。ChatGPT新连接器即将发布,微软Bing新版视频工具上线,并与HyperwriteAI合作提升销售转化率。Hume AI推出情绪感知语音助手EVI 3,性能优于GPT-4o。Perplexity与三星洽谈预装合作,扩展移动AI应用。Hugging Face发布开源人形机器人HopeJR,年内发货。
— 此摘要由ai分析文章内容生成,仅供参考。

对Veo 3印象深刻,它在r/aivideo等社区中展现出的潜力令人振奋。添加音频后,视频质量有了质的飞跃。
视频生成有几个宏观方面可能尚未被充分认识到:
- 视频是大脑接收信息带宽最高的方式。不仅用于娱乐,还广泛应用于工作和学习,如图表、动画等。
- 视频是最容易且有趣的媒介。一般人不喜欢阅读或写作,这需要很大的努力。任何人都可以并且愿意观看视频。
- 视频制作的门槛正在趋近于零。
- 视频首次可以直接优化。
特别是第四点,值得进一步强调。以前,视频主要是通过索引、排名和提供有限的人工创作内容来实现。如果TikTok希望保持用户的注意力,关键在于让创作者制作视频,然后决定向谁展示哪些视频。这种“人类创作者学习用户喜好,然后算法学习如何最好地展示视频”的系统是非常低效的优化器。
而Veo 3及其同类技术的视频输出是神经网络的结果,这是一个可微分的过程。因此,现在可以设定任意目标,并通过梯度下降进行优化。预计这种优化器将比我们目前看到的要强大得多。甚至只是通过迭代优化提示(无论是由人类还是AI完成)也可能是一个强大的优化器。现在我们可以直接针对参与度或其他指标(如瞳孔扩张等)来优化生成的视频,或直接优化广告点击率等商业指标。
为什么只索引有限的视频,而不能无限生成并直接优化呢?视频有潜力成为AI与人类沟通的重要界面,未来的AI图形用户界面等。想象一下,通过一个出色的图表或动画理解一个概念要比面对一大段文字容易得多。视频不仅是人类创造力的绝佳媒介,而且正在变得可以直接优化。在我看来,TikTok相比未来的可能性来说,不过是冰山一角。我并不确定我们是否会喜欢所谓的“最优”结果。
···

OpenAI正在准备推出新的ChatGPT集成连接器,这些连接器将进一步增强用户在日常应用中的体验。此次更新包括一个新系统提示“Slurm”,暂定为“搜索连接器”。此外,还有新的通知提示用户切换到特定模型以使用测试版连接器,这表明新功能可能仅兼容于某一特定版本。

为了进一步方便用户选择合适的模型,模型切换下拉菜单中新增了一个名为“Finch”的部分,可能是新模型的代号。同时,关于ChatGPT商业计划的更多提及也暗示了这项服务可能会与新的连接器一起推出。
值得注意的是,尽管该更新已经部署,但由于存在一些问题,目前已经被回滚至之前的版本。
- 新连接器将使ChatGPT能够更好地与用户日常使用的工具(如Dropbox)集成。
- 通过这些改进,用户可以更轻松地找到答案、总结信息或完成任务。
- 预计未来还将公布更多关于ChatGPT商业计划的信息。
···

视觉内容平台Freepik近日发布了两项令人瞩目的更新,分别是FLUX Kontext和Kling 2.1。
FLUX Kontext是一款专为编辑设计的工具,特别注重角色的一致性。它利用先进的AI技术,帮助设计师在不同场景中保持角色外观的一致性,从而提高工作效率并确保设计质量。这对于需要频繁处理角色形象的品牌和创意团队来说,无疑是一个重要的工具。
Kling 2.1则带来了超现实主义的AI视频生成功能。该工具能够创建出高度逼真的视频内容,不仅在细节上达到前所未有的真实感,还能在短时间内生成大量高质量的视频素材。这对于广告、电影制作以及社交媒体内容创作等行业具有重要意义。
这两项更新标志着Freepik在视觉内容创作领域的又一次飞跃,将为设计师和创作者带来更多的可能性。
···

微软近日宣布在其Bing应用程序中推出了一款由Sora技术支持的全新视频创作工具,该工具面向用户完全免费。
这款视频创作工具利用了先进的人工智能技术,旨在为用户提供便捷高效的视频制作体验。用户可以通过简单的操作创建出高质量的视频内容,无需复杂的编辑技巧。
尽管这一新功能备受期待,但目前仍存在一些限制。例如,用户在使用过程中可能会遇到一些功能上的约束,如视频长度、特效选择等方面的限制。微软表示,这些限制是为了确保用户体验与系统稳定性的平衡。
未来,微软计划逐步优化和扩展该工具的功能,以满足更广泛用户的需求。对于创作者来说,这无疑是一个值得关注的新工具,有助于提升内容创作的效率和质量。
···

在最近的一项评估中,HyperwriteAI进行了A/B测试,以确定哪种模型能够最有效地提升客户的购买率。
该测试涵盖了多个语言模型,最终选择了GPT-4.1作为最优解。GPT-4.1不仅在对话生成和内容创作方面表现出色,还在实际应用中显著提升了用户的购买行为。
HyperwriteAI的这一决策基于对用户交互数据的深入分析,以及对各种模型性能的全面评估。通过这种方式,他们确保了所选模型不仅技术领先,还能在商业上带来实际收益。
这项评估展示了人工智能在优化用户体验和推动业务增长方面的巨大潜力。
···
近日,OpenAI宣布其最新的人工智能工具Sora现已对所有用户免费开放。用户可以通过微软Bing视频创作者应用在移动设备上访问这一功能。
Sora是一款强大的视频生成工具,能够帮助用户轻松创建高质量的视频内容。它结合了先进的自然语言处理和图像生成技术,使得普通用户也能制作出专业级别的视频作品。
此次合作标志着人工智能技术在视频创作领域的又一重大突破。通过将Sora集成到Bing视频创作者中,用户可以在手机上快速生成个性化视频,无需复杂的编辑技能或昂贵的硬件设备。
无论是个人创作者还是企业用户,都可以利用Sora来提高内容创作效率,增强视频内容的表现力。这不仅为用户提供了极大的便利,也进一步推动了人工智能在创意产业中的广泛应用。
···

据消息人士透露,人工智能公司Perplexity正在与三星进行谈判,计划从Galaxy S26系列开始,在三星设备上预装Perplexity应用。此外,Perplexity还可能被整合到三星的智能助手Bixby和三星浏览器中。

这一合作将使Perplexity成为三星生态系统的一部分,为用户提供更丰富的人工智能体验。如果Perplexity能够成功地将三星设备转变为类似Comet浏览器的强大工具,这将是一个巨大的飞跃。
目前,Perplexity已经引起了苹果公司的兴趣,但尚未有明确的合作细节。此次与三星的合作不仅将提升用户体验,还有望推动整个智能手机市场的技术创新。
相关链接:【QuotedContent: NEW: Samsung is nearing wide-ranging deal with Perplexity on an investment and deep integration into devices, Bixby assistant and web browser, I’m told. Arch-rival Apple has been interesting in working with Perplexity as well. Details here — https://t.co/CE8V58RO1n】
···

Hume AI近期发布了其最新产品EVI 3,这款先进的语音助手能够理解用户的语音情绪,并以用户喜欢的声音和风格进行互动。
EVI 3具备多项创新功能:
- 它可以在对话过程中实时搜索和推理,提供智能回答。
- 通过提示生成任意声音,并赋予特定“性格”或“情绪”,使对话更加生动。
- 支持从语音中识别情绪,提升用户体验。
- 具有低于300毫秒的推理延迟,实现近乎实时的响应。
- 支持超过30种复杂语音风格,满足多样化需求。
- 允许用户自定义AI的“声音”和“性格”,使其更贴近个人喜好。
EVI 3在所有七个维度评测上均优于GPT-4o,响应速度显著更快。其性能接近Sesame,远超Gemini,为用户提供更高效、个性化的语音交互体验。
随着人工智能技术的不断进步,EVI 3的推出无疑将为智能家居、客户服务等多个领域带来新的变革。
···

在最新的谷歌IO大会上,谷歌发布了针对Gemini API的重要更新,为开发者们提供了强大的模型、内置推理功能以及先进的代理能力。这些更新使得开发者能够更高效地进行人工智能项目开发。
通过Gemini API,用户可以访问到一系列预训练的高性能模型,涵盖了自然语言处理、图像识别等多个领域。此外,内置的推理机制让机器学习模型能够更好地理解和解释数据,从而提高决策的准确性。
- 强大的多模态处理能力
- 先进的代理执行能力
- 高度可扩展性和灵活性
此次更新不仅提升了技术性能,还增强了用户体验,特别是在复杂任务处理和自动化流程构建方面。对于希望在人工智能领域取得突破的企业和个人来说,这无疑是一个值得探索的机会。
···

近日,知名人工智能公司Hugging Face宣布推出其最新研发的开源人形机器人HopeJR。这款全尺寸的人形机器人具备行走和抓取物体的能力,预计将在年底前开始发货。
HopeJR采用了先进的机器学习算法和传感器技术,使其能够执行复杂的任务,并适应多样的环境。这一创新项目的发布标志着Hugging Face在机器人技术领域的重大突破。
主要特点:
- 全尺寸设计,模拟人类形态
- 具备基本的移动和抓取功能
- 内置多种传感器,提高环境感知能力
- 基于深度学习的控制系统,提升自主决策能力
Hugging Face表示,他们希望通过开源的方式,鼓励更多开发者参与到机器人技术的研发中来,共同推动该领域的发展。此外,该公司还计划在未来几个月内发布更多关于HopeJR的技术细节和应用场景。


评论功能已关闭。