提到文生圖,很多人都會想到植根於根植於Discord社區的Midjourney,本篇文章就基於作者的使用體驗+思考,並結合了Discord來對Midjourney進行探討,感興趣的朋友一起來看看吧。
如果要說現在最火的文生圖,不得不說到Midjourney,它根植於Discord社區,也因此我們聊的時候會結合Discord對它進行展開探討。
坦率說,當下國內並沒有看到一篇真正琢磨Midjourney的文章,更多是媒體報道,在這裡Super拋磚引玉,基於少量的使用體驗+思考,希望能和大家一起撥開迷霧,找到對的方向。
一、 簡述Midjourney
1. Midjourney是什麼?
Midjourney is an independent research lab exploring new mediums of thought and expanding the imaginative powers of the human species.
We are a small self-funded team focused on design, human infrastructure, and AI. We have 11 full-time staff and an incredible set of advisors.
Midjourney是一個獨立的研究實驗室,探索新的思維媒介,擴大人類物種的想象力。
專註於設計、人力基礎設施和人工智慧。
這是它們官網的介紹,我們現在可見的是文本生成圖片的產品,未來產品形態還是可能會出現變化的。
首頁里的第一個按鈕「Join in the beta」,直接會跳轉到它們在Discord上的頻道:
截至目前已經有381萬用戶加入它們的Discord頻道。
大部分工作Midjourney都通過Discord來完成,比如最核心的bot:
用戶主要通過Discord的bot機制,通過提交Prompt(提示詞),獲得圖片。
Midjourney也通過bot機制來完成一些其他工作,比如:
- 將用戶生成的圖片同步到官網的個人中心;
- 通過官網收取訂閱費,再對用戶授予使用次數;
後面會簡單闡述下Discord,方便大家更好地理解Midjourney和Discord是如何共生的。
2. 創始人David Holz
David Holz:我的名字是David Holz,是個連續創業者。簡短來說,我的經歷是:我在高中的時候做過設計生意,大學學的是物理和數學,我在NASA和Max Planck工作的時候攻讀了流體力學博士學位。
有一次我不知所措,把所有的事情都放在一邊。所以我搬到了舊金山,在2011年左右創辦了一家名為Leap Motion的科技公司。我們銷售那些可以在手上做動態捕捉的設備,創造了很多手勢界面空間。
我創立了Leap Motion並且經營了12年,(但)最終,我希望尋找一個不同的環境而不是一家風投支持的大公司,我離開並創辦了Midjourney。
現在,它的規模還很小,我們只有10個人,沒有投資者,而且我們也不是以財務回報為動機的。我們沒有壓力銷售什麼東西也不用成為上市公司,只是為了未來十年能夠有一個家,可以從事很多比較有意義的、酷的項目,希望不僅是對我,還對世界有意義,並且享受樂趣。
【注意,當前資本很熱的情況下確實並未看到Midjourney融資的新聞,並且我猜測付費率應該能過5%(早期全球範圍內幾乎獨此一份),也會帶來一個月200萬美元以上的收入,個人覺得沒有必要拿融資。】
他對於Midjourney的理解大體是這樣的:
「Midjourney不光是想象力的引擎,往未來邁一步,如果不是一次拍攝幾張照片,而是一次拍攝幾萬張照片,面對這一切,我會感覺自己就像是小孩看著水池的深處,知道自己不會游泳,卻能感覺到水池的深度。
AI就是水,人們把它看成老虎,這是錯的。水也有危險,但水也是文明的驅動力,如果人類能知道如何與水共處,會過得更好。
Midjourney是一股新的水源。」
這一段有點韻味,建議翻到文末看一下TheVerge採訪的原文感受一下。
3. Midjourney欲向何方?
We』re working on a lot of different projects. It』s going to be a wide and diverse research lab. But there are themes: things like reflection, imagination, and coordination. And what we』re starting to become well known for is this image creation stuff.
And we don』t think it』s really about art or making deepfakes, but — how do we expand the imaginative powers of the human species? And what does that mean? What does it mean when computers are better at visual imagination than 99 percent of humans?
That doesn』t mean we will stop imagining. Cars are faster than humans, but that doesn』t mean we stopped walking. When we』re moving huge amounts of stuff over huge distances, we need engines, whether that』s airplanes or boats or cars.
And we see this technology as an engine for the imagination. So it』s a very positive and humanistic thing.
Midjourney在做很多不同的項目,但是創造圖像這個工作讓他們出名了。
我覺得他們肯定會在這個有著強烈需求的方向上繼續拓展,包括可以看到他們也在招聘相關的人才來擴展:
但相信有了足夠的資金后,他們還是會在「things like reflection, imagination, and coordination」方向上探索種種可能性。
二、Discord造就Midjourney
「A lot of people ask us, why don』t you just make an iOS app that makes you a picture?」 Midjourney』s founder, David Holz, told The Verge in an interview. 「But people want to make things together, and if you do that on iOS, you have to make your own social network. And that』s pretty hard. So if you want your own social experience, Discord is really great.」
為什麼是Discord?創始人Holz在回答為什麼不做個iOS App的時候,說到,如果我們想做一個自己的社交網路,非常難,但我們想讓大家一起創造,從這點來說,Discord非常棒的實現介質。
這種選擇很好的幫助了Midjourney快速成長,在繼續展開前,我們最好先理解一下Discord是什麼?
1. Discord是什麼?
Discord是2015年上線的,最初主打遊戲語音連麥,基於Voip技術,由於多端支持(特別是支持網頁端)、免費、上手門檻低,然後語音清晰、延時低、連接穩定這些特點,逐步獲得用戶的認可。
疫情之後,由於Discord的社區功能,從遊戲領域破圈,比如,他成了歐洲大量高校的線上教學工具:
圖源知乎
我們可以理解,Discord的本質是一個社區,語音只是他的主打功能之一。
Discord的兩位創始人表示:「Discord與大多數在線社交工具完全不同,它沒有遊戲化系統,沒有追隨者人數,沒有演算法推薦。它就是創造了一個地方,讓你感覺就像你的朋友就在身邊,你遇到他們並與他們交談、閑聊。」
你可以非常便捷的創建伺服器,在伺服器上設立不同的頻道,可以理解為頻道是不同的主題房間。
另外一個很關鍵的點是,Discord有Bot,你可以把它理解為機器人,或者插件,允許第三方在Discord提供的介面下獨自開發。
這極大的擴展了社區的功能,也增加了用戶的粘性,並且支持開放邀請Bot加入頻道的功能(Midjourney也支持了邀請功能)。
Midjourney通過在Discord上創建了自己的伺服器,並創建了大量的頻道,以及開發了自己的機器人,來向用戶提供服務。
2. 如何在Discord里使用Midjourney?
我們進一步,簡單來和大家分享一下如何在Discord里使用Midjourney,這樣一些無法訪問的朋友可以更好地理解:
首先還是要註冊一個賬號,然後進入新手的newbie頻道就可以快速生成圖片:
在newbie頻道,「/」可以掉出所有的命令:
當你輸入/imagine +提示詞,再回車后,就相當於把Prompt提交給了bot,接著會進入生成過程:
會有個從模糊到清晰的圖像生成過程和進度給到你,
完成後會讓你從4張圖中選擇,注意此時還沒有結束,你可以從4張圖中選擇一張來U(Upscale,放大像素並提升細節),或者V(Variation,基於所選圖片來延伸變形),1~4代表著左上到右下的4張照片。
比如我點擊了V4之後,bot又進入了一次新的圖片生成過程:
這裡面,我覺得第二張黑色的太陽不錯,
點了U2:
然後就生成了最終的圖,當然你還可以做變形、用網頁打開原圖,以及給出你的反饋,是驚喜還是失望,等操作。
我點擊了Upscale to Max,把清晰度拉滿,最後生成了:
以上就是生成圖片的過程。
每個新用戶會有一些免費點數,使用完后,Bot會提示你,該交錢啦:
這一部分在後面的商業模式部分會再展開,現在先跳過去,我們下面來聊聊本節標題,為什麼是Discord造就Midjourney?
3. 為什麼是Discord造就了Midjourney呢?
首先,Discord是一個共創的土壤。
Inside the community, you have a million people making images, and they』re all riffing off each other, and by default,everybody can see everybody else』s images. You have to pay extra to pull out the community — and usually, if you do that, it means you』re some type of commercial user.
So everyone』s ripping off each other, and there』s all these new aesthetics. It』s almost like aesthetic accelerationism. And they』re all bubbling up and swirling round, and they』re not AI aesthetics. They』re new, interesting, human aesthetics that I think will spill out into the world.
Holz說,個體的想象力是有限的,但我們發現把人們放到一起,大家就會想象力爆棚,所以我們需要創造一個Midjourney的社交,它就是基礎設施:Discord。
在社區里,大家都在互相模仿,相當於提供了一個共創的土壤。
如果用戶願意付出額外費用脫離社區自己玩,也恰恰說明他們是特殊的商業客戶。
我們來看看Discord可以做什麼:
公告區,創始人Holz發布了一個公告,請付費會員對新的V4演算法產出的圖片質量做一個評分,發動群眾,相當於最後系統會借鑒用戶評分去調整模型的生成傾向。
不同的主題頻道,可以把喜好不同的付費用戶分流到不同的頻道內,幫助用戶之間更好的形成共創。
其次,Discord有廣泛的用戶基礎。
在今年7月底,負責Discord社區運營的高級經理戴(Mindy Day)表示,Discord月活超過1.5億。
廣泛的用戶認知也大幅降低了導流轉化的成本。
包括前面說的Discord支持多端訪問,Super自己都是直接用網頁版本訪問Midjourney頻道,也很流暢,這種體驗的優秀也保證了用戶的使用感受。
最後,Discord的Bot機制可以幫助Midjourney很好地完成服務。
剛才我們介紹過了Bot機制,這裡再做個簡單的總結:
- 用戶給Bot發送Prompt;
- Bot監測用戶的付費情況(以及圖片生成額度情況);
- 如果有限額,Midjourney在後端直接生成圖片並通過Bot返給用戶;
- 如果無限額,提示用戶付費。
由於Discord的這些因素,Midjourney可以持續的快速增長,只需要維護好Bot,以及後端服務即可,大量的降低了其他部分工作量,可以用極少量的員工支持大規模的用戶。
4. 基於Discord的Midjourney由於什麼爆火?
《Théâtre D』opéra Spatial》
8月底,美國科羅拉多州博覽會的美術大賽公布了獲獎結果,一幅名為《太空歌劇院(Théâtre D’opéra Spatial)》的作品在「數字藝術」類別中摘得了桂冠。
這幅圖無論是主題、光影、人物、色彩在專業人士眼中都算得上是上乘之作,然後被爆料是作者使用AI生成的(其實是Ai生成后精修的),被人質疑合法性、公平性,並和藝術可能會消亡掛上鉤。
這引起了軒然大波,當然,Midjourney就是這個新聞背後的AI……事實上也帶來了海量的用戶。
根據報道,Midjourney在8月底應該只有30萬左右用戶,到了9月底就達到了150萬+,說明8月底這次美術大賽事件對他們用戶增長帶來的巨大增長。
再加上前面說的用戶使用門檻最低(只需要加入Discord,輸入Prompt),簡單、效果好、超級牛逼的冷啟動,使得它破圈了,再加上本身基於Discord建立的社區不斷地鼓勵用戶共創、增加了粘性,這個增長迴路使得Midjourney不斷地爆發:
得益於Discord的社區調性、Bot機制實現的共創效果、以及Midjourney生成的高質量圖片抓人的眼球,進而帶來的用戶傳播自增長,這幾個部分共同構成了Midjourney的持續增長。
到今天看到的數據用戶總數已經破380萬。
當然我們也要知道,主動退出Discord的用戶畢竟是少數,380萬可以算是一個累計用戶數(虛榮指標),不過最近登錄Discord,我也發現基本能看到的在線用戶數都在30萬左右,在某種程度上來說,這個用戶活躍度還是很高的。
另一個角度,Midjourney和Discord互相成就,Midjourney也是Discord上用戶數量最多的伺服器。
三、Midjourney商業模式
對於新用戶,Midjourney給了一個25點的免費額度,用完后則需要購買。
購買有兩檔套餐,標準用戶套餐是:
10美元的月度會員支持生成200張圖,大概就是一張圖3毛錢。或者30美元就不限制使用量。
訂閱會員才能進入會員畫廊,妥妥的會員權益呀。
What is the member gallery?The gallery is a place where paid members can explore images being made on the platform as well as visual dictionaries of words and styles. The gallery also acts as a central place to organize your own images, collect favorites, and more.
對於普通會員來說,默認你的圖和Prompt是會被公開的,如果你不想公開,就得買一個50美元/月的隱私通道
另外就是合作夥伴計劃,如果你想在超過100萬美元年收入的公司使用圖片來商用,那就得買這個,一年600美刀。
這麼看起來,Midjourney在收費策略上還是很大膽的,少量的免費額度讓你體驗,一旦用完,就必須買,不然沒得玩。
售賣的策略是訂閱制,而不是國內通常的按使用量付費。
這個模式的成立Super估計得益於幾點:
- 高出圖質量;
- 優秀的共創氛圍;
- 媒體的渲染和優秀的用戶自傳播;
- 超低使用門檻;
- 先發紅利;
- 全球市場;
- 海外用戶對於付費和訂閱制的接受;
Midjourney的商業模式可以再簡單展開聊聊,我們借用產品力三角形來做個描述:
產品力三角形
使用價值:Midjourney可以快速的簡單的生成高質量的圖,並且提供了圖片層面的選擇和變化。
附加值:社區對於Midjourney來說是一個挺高的附加值,這實際上構成了附加值。又由於Midjourney先發,門檻低,大量的用戶可以快速便捷的生成圖片,再拿到社交網路Show,也是附加值的一種:炫耀。
價格:這個價格實際上在國外也不算高,訂閱制大家也普遍的能接受。
所以整體來看,Midjourney的三條邊拉的都還是挺好的,唯一的問題就是隨著時間的推移,使用價值和附加值能不能持續下去存疑。
包括競品增多之後,價格也可能會不再有足夠的競爭力。
值得觀察。
四、Midjourney給我們的啟發
結合國內幾款文生圖的產品一起來看一看:
1. 媒體紅利和先發優勢很重要
競品很多,如何在正確的渠道用正確的方式宣傳,決定了可以獲得多少用戶和流量。
那在對應的渠道里,用什麼方式,如何導流,就很有講究了。很多團隊更多是技術基因,在於借勢這一塊就會存在天然的缺陷。
2. 社區是促活和提高用戶粘性的關鍵
接著,流量來了,如何留住,變成留量也很重要。
因為如果單純只是一個工具,完全沒有前景,因為大家都是基於SD開源做的少量差異化,構不成競爭優勢,隨著入場玩家逐漸增加,就會面臨用戶流失和獲客困難的挑戰。
Midjourney直接把用戶導入到社區化的Discord內是很關鍵的一步。
國內通常使用的策略是微信群,這也面臨很多限制,最大的限制是單個群人數又很低的上限,無法直接把上萬的用戶裝進來。
同時微信群內也不能很好的支持機器人。
對於群的運營機制如果沒有找到好的策略,會導致要麼很消耗運營精力,要麼效果很差慢慢變成死群。
有些小程序會把用戶生成的圖放出來,畫廊或者藝術展的瀑布流方式呈現,但很多時候Prompt也不公開,其次是沒有分類,實時性也很欠缺。促進用戶生產內容的效果很有限。
3. 大膽的付費策略
Midjourney不提供免費排隊通道,上來就直接付費。當然這個和競品稀少有很大關係。
國內要麼是按使用量付費,要麼是幾乎免費,大家還是處在一個先獲取用戶,再獲得融資的toVC策略。
坦白講,這是一種自作聰明的做法,即使現在資本對於AIGC方向很看好,熱錢湧入,但一旦後面風口過了,即使你拿了大筆的錢,一樣會死的非常快。
背後的邏輯很簡單,完全沒有健康的商業模式,並且用戶免費習慣了,轉到付費的情況也會非常的低。
最近可以看到一些拿了融資的、想拿融資的,各種PR,Super看了是皺眉頭,用近乎免費的策略換取用戶,再拿用戶數去要融資,這是非常不健康的。
且行且珍惜吧。
作者:Super黃,公眾號:Super黃的念想,專註於深度產品拆解+商業分析。