比特币行情价格_以太坊行情价格_区块链数字货币大数据服务平台

Ideogram发布新的AI图像模型,与Flux、Midjourney竞争

2024-08-22 06:40
摘要

就在Grok采用Flux.1作为其图像生成器几天后,Ideogram AI发布了Ideogram 2.0,这是一次重大更新,可能会使公司重回巅峰。

Ideogram AI于周三发布了Ideogram 2.0。其下一代文本到图像模型旨在挑战生成人工智能领域中老牌玩家的主导地位。

在备受期待的Flux.1作为Grok on X(又名推特)的主要图像生成器实施几天后,该版本发布了,此举巩固了Flux.1在后稳定扩散XL(SDXL)时代作为强大而多功能竞争者的地位。争夺霸主地位的公开模特包括Auraflow、KwaiKolors、浑源、Lumina和康定斯基3。

该公司在其官方公告中表示:“Ideogram 2.0在许多质量指标上明显优于其他文本到图像模型,包括图像-文本对齐、整体主观偏好和文本渲染准确性。”。

除了新车型,Ideogram还推出了一系列新功能,使整个套件更具竞争力。其中包括一个iOS应用程序和一个面向开发者的API。

Ideogram由前谷歌校友创立,长期以来一直因其将文本生成功能整合到图像模型中的开创性工作而受到认可。这是第一个这样做的模型,还有Stability AI的一个鲜为人知的实验Deep Floyd IF。

图片:Ideogram

随着Ideogram 2.0的发布,该公司提高了其模型输出的整体质量,使其更快、更强大、更通用,这要归功于五种不同预设的新选项:现实主义、绘画、3D、动画和通用实现。

此次更新还引入了调色板,使用户能够更好地控制美学和构图。

Ideogram 2.0中的“真实”风格使用户能够创建看起来像真实照片的图像。Ideogram说:“纹理显著增强,人类皮肤和头发看起来栩栩如生。”。另一方面,“设计”预设侧重于准确和艺术的文本生成。公告中写道:“这使您能够为贺卡、按需打印、海报、插图以及带有长而程式化文字的营销和社交媒体内容创建高级图形设计。”。

除了这两种风格外,“3D”预设侧重于生成模仿计算机渲染的图像,“动漫”预设是MidJourney漫画灵感创作的Niji风格的有力竞争对手,而“通用”预设是一种一刀切的多功能设置,可以使输出适应提示。

社交媒体用户的初步反应总体上相当积极,许多人分享了他们的Ideogram生成的作品,展示了该模型在现实主义和著名人物渲染方面的卓越能力。我们的第一次测试令人满意,特别是在使用“现实主义”预设时,乍一看似乎与Flux.1的性能相匹配。

解密使用Ideogram和Flux Schnell NF4 4 Steps上的相同提示生成的图像

然而,对于想要免费测试它的高级用户来说,这可能不是最好的选择。Ideogram 2.0的免费版本每天限制20张图片(五批四张图片),付费计划每月8美元起,无限制的慢世代计划每月20美元起。然而,它仍然与MidJourney竞争,MidJourney的最低层售价为10美元,无限期慢速世代每月售价为30美元。

Ideogram的产品被定位为MidJourney的更易访问的替代品,因为该模型的自然语言处理功能可以提供更直观、更精简的提示体验,类似于ChatGPT为Dall-E 3提供的提示体验。这与MidJourney依赖于具有特定关键字和命令的传统“SDXL”提示风格形成鲜明对比。

如果钱不是问题,用户可能希望评估功能而不是输出质量,因为这两种模型都很有竞争力。MidJourney提供了一个非常强大的个性化功能,让用户创建自己的风格。它还有一个功能强大的图像编辑器,可以通过相当高的控制水平来调整几代人。

相比之下,Ideogram 2.0为用户提供了对其世代的大量控制,而不必依赖于即时工程或样式转换、LoRA或IPAdapter等其他工具。调色板选项和预设可能是获得个性化结果的好方法,特别是对于新用户。

由Ryan Ozawa编辑。

声明:本文所述观点并非数字焦点的立场,不构成任何投资活动的邀约或建议。本文仅供参考。投资存在风险,请自行评估。转载需注明来源,违者必究!文章投稿请联系miqianbao@gmail.com