这几天测试了一下chatGPT 4o最新的图像生成模型,大为震撼。
它突破了以往图像生成模型无法理解手指和文字的限制,能生成较为自然的手部和具有完整语义的文字。
其次,与以往使用midjourney、stable diffusion最大的不同在于,结合了chatGPT语言模型的图像生成让我可以用自然语言而非提示词组合去指示模型生成图像。这让我感觉我变成了真正的甲方,而4o变成了一个更加拟人的乙方,配合着我的想法做着高效的产出。
尽管在图像生成的连续性上还是会产生较大抖动,生成的图像在细节上有待调整,但是透过它我看到了未来图像生成技术该有的模样:只要我想象得出来,并且能用大白话描述清楚,那么它就能实现我所想的画面。
另一方面,结合前阵子了解到的Topaz Gigapixel AI 这种挂载AI模型的图像放大修复软件,我也在感慨最近几年图像生成模型的飞速迭代。它们真的能替代很多基础的修图与绘画工作,极大地提高设计师的工作效率。不知不觉间它们就会成为设计师必备的基础技能,所以必须时刻保持对最新前沿技术的敏感与关注。
发表回复