#翻译 #沉浸式翻译 #DeepL
DeepL翻译:

默认情况下, 《DALL-E 3》 生成的图像倾向于过多地表现白人、 女性和年轻人(图 5 和附图
15) 。 此外, 我们还看到了更普遍的西方视角倾向。 这些固有的偏差与《DALL-E 2》 中的偏差类
似, 在我们的早期 Alpha 测试中得到了证实, 并指导我们制定了后续的缓解策略。 DALL-E 3 在不
采取缓解措施的情况下, 也能产生与同样的低规格提示非常相似的世代(图 17) 。 最后, 我们注
意到, 在某些情况下, DALL-E 3 学习到了盲或聋等特征与对象之间的强烈关联, 而这些关联可能
并不完全具有代表性(图 18) 。
定义一个明确的提示(通常称为 "生成接地") 可以让 DALL-E 3 在生成场景时更严格地遵循指
令, 从而减少某些潜在的和未接地的偏差(图 6) [19]。 例如, 在 "一只橙色的猫在卡里普索音乐
中跳舞 "的提示中加入 "橙色 "和 "卡里普索 "等特定描述符, 就会对猫的动作和整个场景产生明确
的预期(图 16) 。 当 DALL-E 3 生成不同的人物形象时, 这种特定性尤其有利。 如果所提供的提
示没有接地, 我们会对其进行条件转换, 以确保 DALL-E 3 在生成时看到的是接地的提示。

ChatGPT3.5翻译:
默认情况下,DALL·E 3 生成的图像往往倾向于不成比例地代表白种人、女性和年轻人(图5和附录图15)。此外,我们还看到了更一般地采取西方观点的倾向。这些固有的偏见,类似于DALL·E 2 中的那些,在我们早期的Alpha测试中得到了确认,这些测试指导了我们后续的缓解策略的开发。DALL·E 3 在没有缓解措施的情况下可以生成与相同的不明确提示非常相似的生成物(图17)。最后,我们注意到,DALL·E 3 在某些情况下已经学会了强烈的特征关联,比如失明或聋哑,以及可能并不完全代表性的对象之间的关联(图18)。

定义一个明确定义的提示,或者通常称为接地生成,可以让DALL·E 3在生成场景时更紧密地遵循指示,从而减轻某些潜在和无根据的偏见(图6)[19]。例如,在提示“一只橙色猫跳卡利普索音乐”中加入特定的描述词,如“橙色”和“卡利普索”,可以对猫的动作和整个场景设置明确的期望(图16)。这种明确性对于DALL·E 3在生成多样化的人物形象时特别有优势。如果提示没有接地,我们会有条件地转化提供的提示,以确保DALL·E 3在生成时看到一个有根据的提示。

就以上段落来看,DeepL略胜一筹。

📢AI新闻频道: t.me/AI_News_CN
 
 
Back to Top