我們都知道,AI 在生成文字、圖片,甚至程式碼時,每次的結果都可能有所不同。這種隨機性在許多應用場景下雖然帶來了創意上的優勢,但當我們希望 AI 生成具有一致性的人物或場景時,卻常常會遇到挑戰。例如,在 AI 生成圖片時,難以確保同一個角色能夠在不同的場景中保持一致,這對於需要視覺連貫性的創作者來說,是一個不小的困擾。
AI 生成內容的挑戰:一致性與連貫性
在工作中,我經常需要製作情境影片,而這類影片的核心在於故事性與角色的穩定呈現。然而,AI 生成的影像往往缺乏一致性,導致即便是同一個角色,在不同場景下的外觀可能會有所變化,甚至風格都會不統一。這讓 AI 生成的內容在連貫敘事上受到限制,使得故事難以串聯,進而影響觀眾的沉浸感。
為了解決這個問題,我開始研究 Vidu AI 這項技術,發現它提供了一個很好的解決方案。
Vidu AI:讓 AI 生成影片更具一致性
Vidu AI 是一款能夠透過靜態圖片生成短影片的 AI 工具。它的使用方式相當直覺,只需要上傳一張圖片,輸入相應的指令,系統便能根據這張圖片製作出長度約 4 秒的影片,並確保人物在影片中的外觀保持一致。
為了測試其效果,我使用 ChatGPT 生成了一張 AI 圖片,並讓 Vidu AI 根據這張圖片來製作一段影片。

我希望照片中的女性拿起手機打電話。最終的結果相當令人滿意,影片中的人物表現自然,動作流暢,且畫面中的角色與原始圖片的風格一致,這對於需要連貫視覺敘事的應用場景來說,是一個很棒的突破。
然而,Vidu AI 雖然解決了影片人物一致性的問題,但在免費使用上,仍有解晰度及浮水印的困擾。
我注意到 Google 近期推出的 Google AI Studio,它帶來了一個新的突破,進一步解決 AI 生成影像一致性的痛點。
Google AI Studio:改善 AI 生成圖片的穩定性
Google AI Studio 最近推出了一項圖片生成的新功能,能夠解決 AI 生成內容時,每次輸出的角色與背景都不同的問題。這對於我這種經常需要創作連貫場景與視覺內容的使用者來說,無疑是一大福音。



過去,每當我請 AI 生成一張特定情境的圖片時,即使輸入相同的提示詞,生成的結果仍然可能出現不同的人物、不同的細節,這讓故事的連續性變得難以維持。而 Google AI Studio 的這項新技術,讓 AI 能夠更好地記住特定的角色特徵與風格,確保不同場景中的人物保持一致,這對於影片製作帶來了極大的幫助。
AI 競爭激烈,未來發展令人期待
有趣的是,Google 近來在 AI 領域的發展越來越積極,不斷推出新的功能,挑戰 ChatGPT 在 AI 生成領域的領先地位。這樣的競爭對我們來說無疑是一件好事,因為 AI 技術的進步將變得更快,創作者也能擁有更強大、更便利的工具來實現自己的想法。
隨著 AI 影像生成技術的快速演進,未來我們可能不再需要費盡心思去尋找一致的素材,而是能夠直接透過 AI 設定人物與場景,讓創作變得更加直覺且高效。這不僅讓影像製作變得更簡單,也為行銷、內容創作、數位藝術等領域帶來無限可能。
AI 的世界,已不再是 ChatGPT 獨大,而是進入了多方競爭、相互促進的時代。接下來,我們可以期待更多創新技術的誕生,讓 AI 生成內容變得更加智能與穩定。
讓我們拭目以待,迎接 AI 創作時代的新篇章!