[Ep. 126] 為什麼好檸檬開始有字幕了 | 你一定要開始關心 AI(和 Linux)| 衣櫃裡不可或缺的單品 | 寫程式跟寫曲子,哪一個比較難?

https://wiwi.video/videos/watch/4d8f7e88-cfba-43f3-8cfc-a02856cfd096

羨慕可以用AI,現在我在大陸還用不了。
openAI註冊不了賬號,即使有其他AI,上官網速度被限制得很慢。
不過還好,我可以離開無聊的大陸。真的要珍惜自由😂。
我在去年就有看過一個關於使用Whisper的影片,不過那影片的內容,只有用來產生影片的逐字稿,沒有產生字幕,所以我以為這是只能用來產生逐字稿的,我看完那個影片後,過了段時間,就忘了Whisper的存在。Whisper辨識英文的準確度比YouTube自動產生的英文字幕還準確,辨識一些比較難懂的英文口音,不但比YouTube準確,還比一些英文母語者準確。
面對 AI 科技的快速發展,好像只有人心理上沒辦法讓電腦擔任的職業能倖存。例如:心理諮商或老師,畢竟我們暫且對於人的信任、親近感還是比較強的。話說連「偶像明星」都很有被 AI 取代的可能性,前幾年開始很風行的「Vtuber」其實就是透過真人操縱虛擬人偶進行直播,而且也十分受歡迎,製造了許多商機。未來有一天,技術純熟時,我們其實也不會知道螢幕對面的實況主,到底是真人還是假人,說不定就這麼沉迷下去了。
Wiwi買電腦的時候記得看一下顯卡是哪家品牌,如果是NVIDIA的話就建議不要買,因為Linux對NVIDIA的支援度很差,加上幾乎也沒辦法用Hyprland或Sway這些基於Wayland的視窗管理器(Window Manager),不是會當機,要不然就是進不去Graphical.target,相比之下AMD的顯卡對Linux的支援度是最好的,幾乎一裝就可以用,加上驅動程式是開放原始碼的,所以也不用太擔心用了好幾年過後還有沒有驅動程式的更新。
@blusewill 可是要 nVidia 才可以用 CUDA,那個是玩機器學習最重要的部份~
@wiwi 對,所以Linux很矛盾XD,你可能可以用看看雙卡之類的
@wiwi 這其實也不能怪Linux的錯,因為NVIDIA原本的重心就是放在Windows平台上面,所以驅動程式通常都是Windows比Linux還要好用且穩定,但是NVIDIA在Linux上有小概率會發生,你看起來驅動程式裝了,其實後面發現根本沒有的事情發生(因為我就有發生過這件事
@blusewill 了解~
如果wiwi只是玩stable diffusion的txt2img,最有cp值得選項應該就是RTX3060 12G版本,想要更快買一張4070ti的顯示卡就夠了,12G的VRAM十分足夠了,如果wiwi想要對模型進行微調估計就需要RTX4080或是4090了,當然也可以選擇老款的顯示卡只要VRAM大於等於16G就好了。
wiwi如果想要機器學習入門很推薦 李宏毅 老師的YT頻道,上面有很詳盡的入門課程。
有字幕真的很棒,我工作的地方有時候機器啟動會很大聲,以前沒字幕的話就聽不清楚好檸檬了。而且有了字幕就可以加速加很快來看,對那些要快速追完的人也很有幫助。
以前我會用一個語音辨識軟體叫做 [pyTranscriber](https://github.com/raryelcostasouza/pyTranscriber) 也是自由的
我以前過剪映,他很爛,要連網才能用,離線不讓你用,而且不能導入 srt ,要用 [第三方工具](https://github.com/jackychu0830/jy-srt-tools)
所以現在我換成用 [Davinci Resolve](https://www.blackmagicdesign.com/products/davinciresolve/) 雖然不是自由的,但是很好用l
hi wiwi和檸檬捲,
想請問wiwi,你用來在linux上架設的即時通訊軟體叫做什麼名字呢?
記得之前你們有分享過,淡旺季在哪一級了,
我最近也想來架一個這樣的server,但朋友有個舊iphone,用的還是IOS13,不知道能不能使用他的app,
謝謝你們!
@c469591 Nextcloud 喔!
感謝wiwi推薦Whisper👍,我可能有機會用到,memo一下
感謝念我的留言和解答問題XD
我就預料到好檸檬這個月會聊AI,果然聊了,哈哈。
AI會代替一部分人類工作這點幾乎很確定了。
我有時遇到態度超級差,而且沒有很好地幫忙的人類客服,我現在非常希望他們最先被替代,哈哈!
AI的解答現在已經有模有樣,態度還更好。
我很喜歡的一個遊戲是2018年出的叫Detroit: Become Human. 讓我對AI和仿生人思考很多~
時間軸
0:00:00 為什麼好檸檬開始有字幕了

0:14:32 AI 文字轉圖片
0:21:07 什麼是 AI?
0:26:51 AI 會不會取代我們的工作?

0:31:22 衣櫃裡不可或缺的單品
0:37:20 膠囊衣櫥
0:40:10 YAMAHA 給 Wiwi 的修車衣
0:43:55 檸檬卷的毛衣經驗談

0:51:50 QA time
0:54:08 寫程式跟寫曲子,哪一個比較難?
@ricky_chang 謝謝Ricky ,借我分享YT唷!
誒,痔瘡不是 ㄓˋ 嗎?應該不是 ㄗˋ 吧
@pigpag 我是念ㄓˋ呀~ AI ㄗㄓ不分唷?😂
檸檬卷:真的是大大提升所有人的負擔欸……你不覺得這是一個超大的福音嗎?(9分)
Stable Diffusion 的弱點就是它的名字 diffusion,即圖片是整體生成的,線條的細節違背繪畫基礎,人們可以從這個角度出發辨識某張圖由 AI 生成的可能性。
僅以動漫風格繪畫為例,觀察 pixiv 等網站上標記了 AI 生成標籤的圖,可以發現很多共同點。如,人物的眼睛模糊,有遮擋的背景不連貫,矩形不平直,透視與比例不協調等問題。
此前的圖片裡,人物經常有肢體畸形等問題。但玩家們不斷訓練進化模型,最近已經出現可以模擬指甲這種細節的圖片了,辨認 AI 圖片時需要觀察得更仔細了。
不知 wiwi 有沒有嘗試從聽覺方面辨別 AI 的作品,例如自動生成的伴奏,以及 AI 聲庫製作的演唱等。音樂家的耳朵能比常人捕捉更多的細節吧(?)
現在似乎有能跟 GPT 對打的**開源** AI 聊天機器人了
https://github.com/mistralai/