<p class="ql-block">以《送別》李叔同,歌詞配圖為例討論。</p> 01 簡單提示詞 <p class="ql-block">一,用《送別》歌詞原始詞提示</p> <p class="ql-block">二,借助deepseek生成提示詞。圖像水平有提高。不過由于李叔同原來的歌詞意境已經(jīng)可以,所以也沒有達(dá)到顯著優(yōu)勢。</p> <p class="ql-block">取第二張。青山,白云,山水畫,淡雅色調(diào),留白構(gòu)圖。</p> <p class="ql-block">三,再改進(jìn)。加上長城、烽火臺(tái)。自由發(fā)揮。</p> <p class="ql-block">長城烽火臺(tái)換成沙漠、戈壁灘、駱駝隊(duì)。這些理解很難說一定是到位的,但標(biāo)準(zhǔn)在哪里,恐怕說不清楚。 </p> <p class="ql-block">戈壁灘上駝鈴響</p> <p class="ql-block">如果故事發(fā)生在我國南方呢,那提示詞又得修改,可能的提示詞是“茶馬古道“。</p> 02 圖片可控性討論 <p class="ql-block">以下是一些關(guān)于即夢AI圖片生成可控性的參考意見:</p> <p class="ql-block">我們不妨把提示詞和結(jié)果的關(guān)系,大體上看作是一個(gè)多元函數(shù)。</p><p class="ql-block"> 多元函數(shù)中我們把提示詞看成x?,x?,......,等是自變量, 結(jié)果Z是應(yīng)變量。當(dāng)自變量x 是多個(gè)時(shí),這個(gè)多元函數(shù)要得出一個(gè)確定的結(jié)果,顯然是一個(gè)非常困難的任務(wù)。</p> <p class="ql-block">一、文本提示的優(yōu)化</p><p class="ql-block">? 精準(zhǔn)描述:用戶需要提供清晰、準(zhǔn)確且詳細(xì)的文本提示,明確指出想要生成的圖像內(nèi)容、風(fēng)格、場景等要素。例如,如果想要生成一幅具有未來感的科幻城市景觀圖,可以描述為“未來感十足的科幻城市,夜晚,霓虹燈閃爍,高樓大廈林立,飛行汽車在空中穿梭,賽博朋克風(fēng)格”。</p> <p class="ql-block">二、 細(xì)節(jié)補(bǔ)充:增加對細(xì)節(jié)的描述,有助于模型更好地理解用戶需求,從而生成更符合預(yù)期的圖像。比如在生成人物肖像時(shí),除了說明人物的性別、年齡、發(fā)型等基本信息外,還可以補(bǔ)充人物的服飾風(fēng)格、表情神態(tài)、背景環(huán)境等細(xì)節(jié)。</p><p class="ql-block">? 避免歧義:盡量使用簡潔明了的語言,避免使用模糊或容易產(chǎn)生歧義的詞匯。例如,不要簡單地說“一個(gè)大的物體”,而應(yīng)該具體說明是“一個(gè)直徑為1米的圓形氣球”。</p> 03 模型自身的特點(diǎn)和局限 <p class="ql-block">接寫出函數(shù)與自變量的關(guān)系: z = f(x_1, x_2, \dots, x_n) 例子:</p> <p class="ql-block">? 訓(xùn)練數(shù)據(jù)的影響:即夢AI的生成效果受到其訓(xùn)練數(shù)據(jù)的限制。如果訓(xùn)練數(shù)據(jù)中某一風(fēng)格或類型的圖片較少,那么在生成該風(fēng)格的圖像時(shí),可能會(huì)出現(xiàn)效果不佳或不符合預(yù)期的情況。【為什么年輕女性的畫面比較多,老年男性的畫面顯然比較少】</p><p class="ql-block">? 多條件控制的挑戰(zhàn):當(dāng)同時(shí)引入多個(gè)控制條件時(shí),可能會(huì)出現(xiàn)條件之間的沖突,從而影響生成圖像的質(zhì)量和可控性。例如,同時(shí)指定人物的姿態(tài)和動(dòng)作,可能會(huì)導(dǎo)致生成的圖像在姿態(tài)和動(dòng)作的準(zhǔn)確性上出現(xiàn)偏差。</p><p class="ql-block">? 模型更新和優(yōu)化:即夢AI不斷進(jìn)行版本更新和優(yōu)化,以提升圖片質(zhì)量和可控性。用戶可以關(guān)注其最新版本的功能改進(jìn)和優(yōu)化內(nèi)容,以便更好地利用該工具。</p><p class="ql-block">可控性提升的技術(shù)方向</p><p class="ql-block">? 動(dòng)態(tài)條件組合:像DynamicControl這樣的框架,通過自適應(yīng)地選擇不同條件,實(shí)現(xiàn)了動(dòng)態(tài)多控制對齊,顯著增強(qiáng)了圖像生成的可控性。即夢AI可以借鑒這種思路,進(jìn)一步優(yōu)化其條件控制機(jī)制。</p><p class="ql-block">? 多模態(tài)融合:未來圖像生成模型需要更好地融合文本、圖像、語音等多模態(tài)信息,實(shí)現(xiàn)跨模態(tài)的高效生成與控制。即夢AI可以探索如何更好地利用多模態(tài)信息來提升圖片生成的可控性,例如通過語音指令輔助生成圖像。</p><p class="ql-block">? 損失函數(shù)的改進(jìn):通過改進(jìn)損失函數(shù),如結(jié)合像素級(jí)一致性損失和擴(kuò)散訓(xùn)練損失,可以在提高控制性的同時(shí)不損害圖像質(zhì)量。即夢AI可以在模型訓(xùn)練過程中,進(jìn)一步優(yōu)化其損失函數(shù)的設(shè)計(jì)。</p> 04 用戶反饋和社區(qū)交流 <p class="ql-block">? 反饋機(jī)制:用戶可以通過即夢AI的反饋渠道,及時(shí)向開發(fā)團(tuán)隊(duì)反饋生成圖像中的問題或不滿足預(yù)期的地方。開發(fā)團(tuán)隊(duì)可以根據(jù)用戶的反饋,對模型進(jìn)行針對性的優(yōu)化和改進(jìn)。</p><p class="ql-block">? 社區(qū)交流:參與即夢AI的用戶社區(qū),與其他用戶交流使用經(jīng)驗(yàn)和技巧。在社區(qū)中,用戶可以分享自己成功的文本提示案例,也可以討論如何解決生成圖像時(shí)遇到的問題,共同探索提升可控性的方法。</p> 05 進(jìn)一步討論 <p class="ql-block">這是一個(gè)很復(fù)雜的話題。</p><p class="ql-block"><a href="http://www.xsjgww.com/5bihcb7f" target="_blank">"AI 提示語"是"程序設(shè)計(jì)語言" 嗎?我與deepseek的有趣對話</a></p>
主站蜘蛛池模板:
江口县|
松原市|
西青区|
扶风县|
海城市|
双牌县|
郧西县|
兴安盟|
新巴尔虎右旗|
广平县|
娱乐|
尖扎县|
女性|
姚安县|
云安县|
乐昌市|
巴中市|
崇阳县|
盱眙县|
阿鲁科尔沁旗|
繁昌县|
尚志市|
罗城|
毕节市|
如东县|
积石山|
冕宁县|
崇义县|
农安县|
中宁县|
竹溪县|
元朗区|
永福县|
依兰县|
吉隆县|
濉溪县|
鹤庆县|
汉沽区|
巢湖市|
石泉县|
区。|