
【AI教學】貓咪玩手機被抓包
用Grok製作圖生影片,用動物擬人化做出有趣AI短影音
被抓包了還藏
Sneaky Kitty!

使用工具
1. 照片:找一張生活中你家的動物照片,或是請Grok/Nano Banana生圖
2. Grok 圖生影片
3. 用剪映串接
腳本說明
我是 AI內容煉金師 Melody,歡迎來到 「AI內容資產實驗室」,這篇AI教學,透過一張真實貓咪照片,如何讓你家的貓動起來,還做一些貓咪不會做的事情,比方滑手機、像小孩子鬧脾氣?這篇內容教你用Grok來做出這隻貓咪看手機的AI短影音內容。
由於我家去年養了一隻流浪貓,領養的時候牠就是叫「小胖」,一開始來我們家的時候瘦瘦的,才短短兩周,就變得很胖。牠是一隻像乳牛一樣黑白相間毛色的貓,大約四歲左右吧。有天,牠爬到陽光明媚的書桌上曬太陽舔毛,我把牠拍了下來。
由於想要紀錄牠的樣子,同時小孩們愛玩手機,當手機被爸媽限制使用時,也會鬧個一番。因而想出這段AI短影音腳本。
1. Grok 圖生影片
如同一開始說的,先找一張生活中你家的的寵物物的照片,如果沒有養寵物的人,可以使用 Grok 或 Nano Banana 生圖,這段圖片的生成很簡單,我就先不說了。
接下來,再把這張圖片,上傳到 Grok 中,到左側找到「Image」。

然後選擇生成「影片」,尺寸選「9:16」,畫素我選「480p」,影片長度「10秒」,你要選「6秒」也行。這邊解釋一下為什麼不選720p,因為畫素越高,則消耗的「算力」越多,如果你用免費版的話,沒生幾部影片,就不能再生了,這樣就要等隔天。同理,影片長度越長,消耗的算力也越多。
而我憑經驗值判斷,我要讓貓看手機滑手機,然後還要藏起來,這一連串動作10秒會是比較足夠的,所以我這次選10秒。像是其他情況,我大多選6秒。
再來,你可能會有個疑問,選480p的話,那這樣不就畫質不好嗎?我在下一段解釋。

下面這一個畫面,是我將我家的貓照片上傳到Grok後,寫下提示詞 (指令/Prompt),然後Grok幫我生出的畫面。從圖片上我有標註,我同一張圖是重複生成影片,到了第七次生出來的片段,貓咪的動作與手上的手機的呈現方式,才是比較貼近我想要的樣子。也就是說,我前面六次一直花費算力,但是沒有得到我想要的。
針對這段我想要的,我再去按影片右側某個提升畫質到720P的按鈕,這樣是不是比較make sense?(等一下節圖標示跟你說在哪邊升級畫質),你看下面貓咪影片的左上角是不是有一個「HD」的字樣,表示這影片片段就是被我升級到720p畫質過。
分鏡一:貓咪愉快滑手機

【提示詞】:(下面請直接複製貼上)
我家的貓正在像人類一樣拿著手機看影片,貓咪樂在其中、專心忘我。手機螢幕畫面始終面對著貓咪的臉,而手機的背面對著鏡頭。無配樂,只有環境音。
分鏡二:貓咪聽到主人喊牠名字,怕主人發現牠滑手機

【提示詞】:(下面請直接複製貼上)
我家的貓發現主人在叫他的名字:「小胖~?」貓咪一驚,突然停止動作,隨即快速地把手機往窗簾布下塞,把窗簾布拉過一角來遮住手機。
分鏡三:主人呼喊小胖、找小胖
這個分鏡我要說,我先把我的照片丟進去後,給提示詞,但這個分鏡我生成了16個影片片段,其中只有2個影片片段有比較貼近我想要的素材。分別在第11次生成,和第13次生成的影片片段中,而且我在剪輯的時候,不是第11次和第13次生成的那10秒全都用,只有取那片段中的一小點畫面來用。
以下就是第11次和第13次生成的影片片段,我有取其中的畫面當作主人找小胖,以及發現小胖玩手機的鏡頭。

【提示詞】:(下面請直接複製貼上)
畫面中不要有文字。畫面原本是一扇沒開啟的門 (女子不在畫面中),後來這個紅衣女子打開這扇米白色高級優雅感的房間門,用特寫鏡位拍出她打開瞬間,她用台灣腔大叫:「小胖!」。房間內的清晨的陽光灑在臉上與室內,她手扶在門把上,頭探到房間內一望,眼神略微向下方看,看一眼後,些微皺眉,她似乎發現甚麼
分鏡四:主人發小胖玩手機

【提示詞】:(下面請直接複製貼上)
畫面中不要有文字。畫面原本是一扇沒開啟的門 (女子不在畫面中),後來這個紅衣女子打開這扇米白色高級優雅感的房間門,從外面推開到裡面,用特寫鏡位拍出她打開瞬間,她用台灣腔大叫:「小胖!」。房間內的清晨的陽光灑在臉上與室內,她手扶在門把上,頭探到房間內一望,眼神略微向下10度直視,看一眼後,些微皺眉,她似乎發現甚麼
分鏡五:主人沒收手機、貓鬧脾氣

【提示詞】:(下面請直接複製貼上)
手機被貓咪藏在窗簾布下遮住,女主人發現貓咪藏起手機,生氣地說:「看甚麼手機!」,畫面女主人只出現一隻手在畫面中,隨即一隻手來把藏在窗簾下的手機拿走,貓咪發現手機被主人拿走後,四腳朝天、身體躺著大扭動、大鬧抓狂,生氣地嘶吼喵喵叫、貓的聲音可以像怒吼發出喵嗚喵嗚的貓咪吵架聲。
前面有提到,建議影片畫質一開始不要設定為720P,而是經過幾次生成後,確定生出來的這個片段是你要用的,這時候再來升級影片畫質。
如何讓480P升級為720P (HD畫質)?

2. 用剪映串接影片畫面
把前面用Grok生成的各段畫面,在剪映(或其他剪輯軟體)中串接在一起,想搭配音樂或不放音樂都可以,這樣就大功告成了!
如果你覺得720P的畫質還是不夠,那接下來,進到剪映中串接影片畫面,在最後一段要「輸出影片」(導出) 時,選擇分辨率為1080P。


Melody│AI內容煉金師
Prompt to Profit
AI內容資產實驗室
© 2026











