DeepSeek sebelum rilis V4: karakteristik, organisasi, dan tujuan unik Liang Wenfeng

金色财经_ · 2026-04-02T11:49:09+00:00

DeepSeek sedang berada di ambang perubahan. Sejak paruh kedua tahun 2025 hingga saat ini, anggota DeepSeek yang telah meninggalkan atau menemukan tempat baru meliputi:- Wang Bingxuan, yang direkrut oleh Tencent姚顺雨 pada akhir tahun lalu. Dia adalah penulis inti dari DeepSeek LLM (model bahasa besar generasi pertama DeepSeek), dan sejak itu terlibat dalam pelatihan berbagai model. - Wei Haoran, yang meninggalkan sekitar sebelum dan sesudah Tahun Baru Imlek. Dia adalah penulis inti dari seri DeepSeek-OCR dan kemungkinan akan bergabung dengan perusahaan besar. - Guo Daya, yang resmi meninggalkan perusahaan baru-baru ini. Dia adalah penulis inti dari DeepSeek-R1 dan kemungkinan akan bergabung dengan perusahaan besar. - Dan阮翀, yang meninggalkan perusahaan dan memasuki masa pensiun pada awal tahun 2025. Dia secara resmi mengumumkan bergabung dengan perusahaan startup mengemudi otomatis Yuanrong Qixing pada Januari tahun ini;阮翀 adalah dari

金色财经_

2026-04-02 11:49:09

DeepSeek berada di persimpangan yang berubah. Sejak paruh kedua 2025 hingga sekarang, anggota DeepSeek yang sudah pasti meninggalkan dan menemukan tempat baru ada:

Wang Bingxuan, yang direkrut oleh Yao Shunyu dari Tencent pada akhir tahun lalu. Ia adalah penulis inti DeepSeek LLM (DeepSeek generasi pertama model bahasa besar). Setelah itu, ia terlibat dalam pelatihan model-model dari tiap generasi.
Wei Haoran, yang sekitar sebelum dan sesudah Imlek pergi. Ia adalah penulis inti seri DeepSeek-OCR, dan kemungkinan akan bergabung dengan suatu perusahaan besar.
Guo Dayaya, yang baru saja resmi berhenti kerja. Ia adalah penulis inti DeepSeek-R1, dan kemungkinan akan bergabung dengan suatu perusahaan besar.
Serta Ruǎn Chōng, yang meninggalkan pekerjaannya dan memasuki masa pensiun pada awal 2025. Tahun ini pada bulan Januari, ia resmi mengumumkan bergabung dengan perusahaan rintisan kendaraan otonom Yuanrong Qixing; Ruǎn Chōng adalah anggota senior yang bergabung sejak era Fang (幻方), dan merupakan kontributor inti atas berbagai capaian multimodal DeepSeek seperti Janus-Pro.

DeepSeek sebelumnya belum melakukan pendanaan, sehingga tidak ada valuasi perusahaan yang jelas. Ketika nilai pasar atau valuasi perusahaan AI lain terus melonjak, Liang Wenfeng sedang mencari cara untuk menjawab keraguan anggota tim: perusahaan ini sebenarnya bernilai berapa? Ini berkaitan langsung dengan nilai seperti apa sebenarnya opsi (options) yang ditandatangani karyawan.

Sejak musim gugur 2025, Liang Wenfeng juga mulai lebih sering mendorong pengembangan produk dan komersialisasi. DeepSeek sudah memiliki tim produk berjumlah belasan orang, tetapi belum masuk ke arah aplikasi populer seperti pemrograman AI atau general Agent, dan di sisi C-end masih hanya ada produk chatbot yang khas.

Topik baru yang digarap Liang Wenfeng juga mencakup skala manajemen. Jumlah personel DeepSeek telah melampaui Fang (幻方), dan itu adalah organisasi terbesar yang pernah ia kelola.

Perubahan-perubahan berlapis di atas justru membuat DeepSeek V4 masih belum dirilis secara resmi.

Sebenarnya, sekitar Januari 26, versi dengan parameter kecil dari V4 sudah diberikan kepada beberapa komunitas kerangka kerja open source untuk mulai melakukan adaptasi. Berdasarkan perkiraan yang sebelumnya relatif optimistis, versi dengan parameter besar dari V4 semula mungkin dirilis dan diopen source sekitar pertengahan Februari, sebelum dan sesudah Imlek. Menurut informasi, DeepSeek V4 kemungkinan akan dirilis pada bulan April.

Ada yang pergi, lebih banyak orang memilih tinggal. DeepSeek sedang beradaptasi, tetapi juga memiliki banyak karakteristik yang tidak berubah.

DeepSeek adalah salah satu-satunya “tidak ikut merunduk” (tidak ikut perang kerja/kompetisi) core AI Lab di dunia. Ketika para pengembang AI inti dari perusahaan-perusahaan Tiongkok dan Amerika seperti Google, OpenAI, xAI, ByteDance, dan lain-lain bekerja 70~80 jam per minggu, kebanyakan karyawan DeepSeek di hari biasa akan keluar dari kantor sekitar jam 6~7 sore. Mereka juga tidak melakukan absensi masuk pada pagi hari.

Liang Wenfeng berpandangan bahwa waktu seseorang untuk menghasilkan output berkualitas tinggi dalam sehari sulit melampaui 6~8 jam.

DeepSeek tidak memiliki penilaian kinerja yang jelas maupun DDL (batas waktu). Organisasi yang ringkas namun tingkat kepadatan talenta yang tinggi ini tetap meneruskan pembagian kerja yang “alami”; para peneliti bisa bebas membentuk tim atau meneliti ide-ide baru secara mandiri.

“Selain jalur utama, DeepSeek juga memiliki orang yang melakukan beberapa penelitian jangka panjang yang mungkin tidak menghasilkan apa pun selama setahun.” “DeepSeek adalah tempat yang benar-benar ingin melakukan penelitian; di Tiongkok, bahkan di seluruh dunia, sulit menemukan tempat yang lebih baik.” Demikian kata seseorang yang dekat dengan DeepSeek.

Tentu saja, DeepSeek juga punya satu ciri: misterius. Terutama setelah 2025, selain publikasi laporan teknis secara terbuka, dari pendiri Liang Wenfeng hingga seluruh anggota tim yang secara kolektif “diam”, sulit mendengar suara mereka di media sosial atau komunitas yang aktif di kalangan praktisi AI.

Dalam laporan ini, kami menyajikan karakteristik DeepSeek yang diketahui dari berbagai kanal, fokus pekerjaan, cara organisasi beroperasi, serta perubahan yang tengah terjadi pada organisasi yang belum sampai 200 orang ini. Semua bermula dari tujuan unik yang ditetapkan Liang Wenfeng untuk DeepSeek.

Profil Liang Wenfeng: melakukan sedikit hal, mencapai puncaknya

Tujuan AI Liang Wenfeng sudah jauh sebelum DeepSeek didirikan pada 2023.

Pada tahun 2016, Hasabis—pencetus AGI dan pendiri DeepMind—membentuk tim perdagangan kuantitatif, mencoba mendapatkan pemasukan untuk DeepMind yang saat itu ingin berdiri sendiri dari Google. Namun, pada akhirnya tidak menghasilkan uang.

Di tahun yang sama, Liang Wenfeng yang lulus dari kampus (sarjana dan magister) di Zhejiang University sudah 8 tahun melakukan investasi kuantitatif. Ia mendirikan Fang (幻方) pada 2015, mulai menjalankan trading live deep learning menggunakan GPU sejak 2016, dan pada akhir 2017 mewujudkan “hampir semua strategi trading di-AI-kan”. Pada 2019, ia mulai membangun klaster komputasi pertama Fang, dengan 1100 GPU “Firefly 1”.

Juga pada tahun 2019, Fang AI (Perusahaan Riset AI Dasar Fang—幻方人工智能基础研究有限公司) secara resmi terdaftar dan didirikan. Sekarang Luo Fuli yang bertanggung jawab AI di Xiaomi dan Ruǎn Chōng yang baru bergabung dengan Yuanrong sama-sama bergabung setelah periode ini, lalu pada 2023 beralih ke DeepSeek.

Sebagai seseorang yang kurang dari 30 tahun sudah bebas finansial, kehidupan Liang Wenfeng sederhana sekaligus misterius.

Menurut kesan orang-orang di sekitarnya, ia memakai pakaian yang sama selama berhari-hari. Di Hangzhou, ia pernah tinggal lama di hotel; di Beijing, tempat mayoritas tenaga R&D DeepSeek berada, ia menyewa rumah. Tubuhnya ramping, punya kebiasaan berolahraga. Aktivitas luar yang ia dikenalinya adalah hiking dan olahraga outdoor lainnya.

Jenner (黄仁勋) akan mengundang karyawan NVIDIA ke rumah untuk bertamu, minum anggur kecil, mengobrol santai, dan dengan gembira menunjukkan mobil sport. Namun Liang Wenfeng tidak ikut kegiatan team building kuartalan, jarang makan bersama para anggota, dan saat big team building akhir tahun pun hanya terlihat ketika memberikan sambutan; ia tidak ikut sepanjang acara.

Pada 2022, seorang karyawan Fang (“Babi Kecil yang Biasa-biasa Saja” / 一只平凡的小猪) secara pribadi menyumbang 1,38 miliar yuan kepada lembaga amal. Belakangan banyak orang menebak bahwa “babi kecil” itu adalah Liang Wenfeng. Balasan staf Fang adalah: “Setoran karyawan bersifat anonim; perusahaan internal juga tidak mengetahui identitas asli si ‘babi kecil’.”

Dalam lingkup kerja, Liang Wenfeng hanya melakukan sedikit hal. Ia tidak melakukan hal-hal yang biasanya dilakukan CEO banyak startup, seperti pendanaan.

Pada 2023, Liang Wenfeng pernah bertemu dengan beberapa investor dalam skala kecil. Tetapi menurut informasi kami, ia mengemukakan permintaan yang tidak lazim: seperti perjanjian investasi OpenAI dengan Microsoft, Liang Wenfeng berharap pihak investor menerima batas atas imbal hasil. Dalam pertemuan putaran ini, tidak ada institusi yang berinvestasi di DeepSeek.

Setelah dua tahun berikutnya, pendanaan model-model besar di Tiongkok memanas, muncul banyak kesepakatan putaran raksasa bernilai beberapa ratus juta dolar. Namun Liang Wenfeng tidak lagi menemui investor, bahkan tidak membangun kontak baru. Meski tidak sedang berada di “window” pendanaan, kebanyakan pendiri tetap tidak menolak untuk sekadar saling mengenal dengan partner institusi lini pertama, tapi Liang Wenfeng menolak sebagian besar permintaan semacam itu.

Hampir seluruh waktunya ia investasikan pada sedikit hal yang menurutnya harus menjadi fokus, dan ia melakukannya secara teliti hingga mencapai tingkat terbaik.

Salah satu kunci keberhasilan DeepSeek sebelumnya adalah “menghasilkan tenaga dari satu lubang” (力出一孔): dengan jelas menjadikan language model sebagai prioritas yang lebih tinggi, tanpa melakukan arah populer seperti generasi multimodal.

Dalam jalur utama yang dipilih, Liang Wenfeng akan “hands on” masuk sedalam mungkin ke detail. Ia mempelajari pengetahuan tentang algoritma, arsitektur, Infra, dan data dari anggota tim dengan beragam latar belakang, dan ia juga ikut berpartisipasi dalam diskusi detail tentang model dan produk.

Banyak orang yang pernah bertemu Liang Wenfeng menyebutkan bahwa ia tidak punya “aura” CEO atau “aura jenius” yang terkenal. Ia lebih mirip seorang peneliti; yang paling sering ia bicarakan dengan orang adalah masalah teknis yang spesifik.

Zhang Jinjiang—pendiri dan partner OASIS Capital (绿洲资本)—pernah membagikan sebuah cerita kecil dalam “Orang-orang yang Hidup Melalui Hal yang Hidup”—ia bertanya kepada dirinya sendiri tentang pendiri MiniMax, Yan Junjie: “Apakah ada orang yang lebih fokus daripada dirimu?” Yan Junjie menjawab bahwa pada suatu waktu ia sempat membuat janji makan dengan seorang teman yang belum pernah ia temui. Karena datang lebih awal, ia melihat seorang pria yang memakai kaos T-shirt, mengira itu asisten. Orang itu tidak memperkenalkan diri, lalu menanyakan banyak pertanyaan teknis kepada Yan Junjie. Setelah setengah jam, Yan Junjie bertanya: “Kapan Tuan Liang datang?” Orang itu menjawab: “Saya adalah Liang Wenfeng.”

Organisasi DeepSeek: datar, pembagian kerja lintas, tidak lembur

Selaras dengan gaya Liang Wenfeng, organisasi DeepSeek sangat datar, pembagian kerja saling tumpang tindih di setiap tahap, ekspansi skala yang hati-hati, dan tidak lembur.

Saat mendirikan Fang, Liang Wenfeng punya partner; tetapi DeepSeek tidak memiliki wakil nomor dua. Terutama di tim penelitian, hanya ada dua lapisan: Liang Wenfeng dan para peneliti lainnya. Liang Wenfeng mengambil keputusan-keputusan besar dan menanggung hasil paling banyak.

Bagian tim penelitian ini sekarang berjumlah sekitar lebih dari 100 orang; ia seperti sebuah laboratorium besar. Peneliti DeepSeek yang mayoritas lahir sekitar 2000-an cenderung menyebut Liang Wenfeng yang lahir pada 1985 sebagai “Boss Liang.” “Boss” ini lebih dekat dengan sosok mentor: mengelola pengembangan R&D organisasi, mengoordinasikan sumber daya, dan juga melakukan riset spesifik; dalam capaian bersama, namanya tercantum sebagai penulis korespondensi.

Hal yang paling sering dilakukan Liang Wenfeng sendiri adalah terlibat dalam tim arsitektur model dasar (base model). Ia akan mendiskusikan secara mendalam bersama tim sebelum menentukan versi arsitektur tiap generasi model dasar. Tim ini beranggotakan puluhan orang. Mereka adalah kekuatan utama untuk pretraining.

Yang sangat berkaitan dengan arsitektur model dasar adalah tim Infra dan tim data. Keduanya masing-masing beranggotakan puluhan orang. Tim Infra, di beberapa perusahaan, lebih mirip “vendor internal” untuk kebutuhan algoritma; sedangkan di DeepSeek, tim Infra akan ikut dalam tahap penetapan versi sebelum pelatihan model, ikut berdiskusi dan memberi saran.

Kerja sama yang erat antar modul membuat batas tim DeepSeek tidak terlalu jelas, membentuk “pembagian kerja lintas”. Ini sebenarnya merupakan bentuk kolaborasi yang paling sesuai dengan karakteristik pelatihan model, karena pada tahap eksperimen dan penetapan versi model, harus dipertimbangkan pemilihan data dan implementasi Infra.

Liang Wenfeng adalah “detektor” dan “pengikat” yang menghubungkan modul-modul berbeda ini. Ia akan menghadiri rapat dari setiap tim, mempelajari progres global serta titik macet. Rapat mingguan sebagian besar tim DeepSeek juga terbuka untuk orang dari tim lain, sehingga bisa lintas tim ikut hadir.

Gaya person dengan posisi nomor satu yang mendalami detail dan kolaborasi ketat yang terbentuk secara spontan sulit diwujudkan dalam organisasi besar. Karena itu DeepSeek sangat hati-hati saat memperbesar skala tim inti R&D.

Satu hal yang sangat tidak biasa di kalangan AI global adalah bahwa DeepSeek tidak lembur. Mereka tidak melakukan absensi, tidak ada penilaian kinerja yang jelas, dan pada hari-hari biasa kebanyakan anggota akan keluar kantor sekitar jam 6~7. DeepSeek juga menyediakan benefit gratis setelah jam kerja, seperti kursus olahraga bola, penggantian biaya lokasi olahraga, dan sebagainya.

Liang Wenfeng berpandangan: waktu seseorang setiap hari untuk bekerja dengan kualitas tinggi sulit melampaui 6~8 jam. Dalam kondisi kelelahan akibat lembur, penilaian yang buruk justru akan menyia-nyiakan sumber daya komputasi berharga; hasilnya tidak sebanding dengan kerugian.

Dari komposisi personel, sebelumnya DeepSeek hampir tidak melakukan rekrutmen sosial (社招), lebih mengutamakan mempertahankan lulusan baru dan magang. Pada awal 2025, 《LatePost》 pernah merangkum 172 peneliti yang pada saat itu terlibat dalam tiga generasi model DeepSeek (LLM, V2, V3&R1)—termasuk para magang—dan menemukan riwayat 84 orang di antaranya. Hasilnya: lebih dari 70% adalah sarjana dan magister; lebih dari 70% berusia di bawah 30 tahun.

Sebelum V3 dan R1, DeepSeek merupakan bagian dari barisan teratas model besar global dengan jumlah orang sekitar 1/10 dibanding perusahaan besar, dan waktu kerja rata-rata sekitar 1/2—dengan fokus dan konsentrasi yang sangat tinggi.

Namun seiring semakin banyaknya arah yang perlu dieksplorasi untuk mencapai kemampuan AI kelas atas, mempertahankan ukuran organisasi, cara komunikasi, dan suasana kolaborasi seperti itu menjadi semakin sulit.

Dalam 15 bulan terakhir, DeepSeek terus menjadi dirinya sendiri, sementara dunia luar berubah drastis

Setelah V3 dan R1 meledak di awal 2025, DeepSeek tidak mengejar dengan “bonus” melainkan melanjutkan pengembangan sesuai arah yang mereka fokuskan. Capaian yang sudah dipublikasikan kira-kira ada tiga jenis:

Pertama, optimasi efisiensi: memeras habis-habisan kemampuan hitung GPU, meningkatkan seberapa banyak kecerdasan yang bisa dihasilkan per unit komputasi. Ini mencakup seluruh set pelatihan dan inferensi Infra yang dirilis open source pada awal 2025 melalui “open source weekly”, mencakup inference kernel, library komunikasi, library perkalian matriks, dan kerangka kerja pemrosesan data. (Catatan: kernel adalah kode yang menjalankan komputasi paling dasar di GPU, digunakan untuk menjalankan operasi inti seperti perkalian matriks.)

Selain itu, peningkatan berkelanjutan pada “mekanisme attention”: misalnya NSA (native sparse attention) pada awal 25, dan kemudian DSA (dynamic sparse attention). Ditambah lagi MLA (multi-head latent attention) yang ada sejak V2 yang lebih awal. Tujuan bersama mereka adalah memproses konteks yang lebih panjang tanpa menambah komputasi secara besar-besaran.

Dari DeepSeek-V3.2 yang diperbarui hingga akhir September 25, terlihat bahwa DeepSeek bahkan mengganti pustaka operator tingkat dasar dari bahasa arus utama seperti CUDA dan Triton menjadi TileLang. CUDA adalah bahasa tingkat paling dasar yang disediakan NVIDIA. Triton adalah bahasa yang diopen source oleh OpenAI, sedangkan TileLang adalah proyek open source yang diprakarsai oleh tim Yang Zhi di Peking University.

Kedua, peningkatan arsitektur model, seperti mHC (popular constraint hyper-connection) yang dirilis pada awal 26. Ini bertujuan meningkatkan stabilitas dalam pelatihan skala besar; dan Engram yang membangun memori jangka panjang di luar model. Pihak luar umumnya percaya mHC akan digunakan dalam pelatihan V4.

Ketiga, beberapa eksplorasi “non-mainstream”, seperti DeepSeek-OCR yang mengubah teks menjadi gambar, lalu memasukkannya ke model. Gagasan ini membuat model memahami paragraf dan hierarki dengan cara yang lebih dekat dengan “melihat teks” ala manusia, sehingga meningkatkan kemampuan memahami dokumen kompleks.

Di dalam DeepSeek sendiri, masih ada lebih banyak upaya yang sedang berlangsung seperti ini, termasuk continual learning, self-learning, dan lain-lain.

Liang Wenfeng juga merekrut beberapa penasihat dengan latar belakang ilmu saraf dan ilmu otak pada 2025, ingin mengeksplor mekanisme pembelajaran yang lebih mendekati otak manusia.

Sementara itu, pada periode yang sama, lingkungan AI di luar berubah drastis dari 2025 hingga sekarang. Ada dua jalur kompetisi yang paling mendapat perhatian:

Pertama, model dan aplikasi Agentic yang berbasis kemampuan coding. Ini adalah medan perang kompetisi paling sengit saat ini antara Anthropic dan OpenAI. Muncul dua model terbaru: Opus 4.6 vs GPT-5.4, serta dua produk: Claude Code vs Codex. OpenClaw yang meledak sejak awal tahun juga merupakan bentuk terbaru dari aplikasi Agentic, yaitu “udang kecil” (小龙虾).

Kedua, generasi multimodal. Bidang ini berkali-kali “keluar lingkaran” karena efek seperti “magis”: OpenAI GPT-4o pada musim semi 2025, Google NanoBanana pada musim gugur, hingga Byte Seedance 2.0 sebelum Imlek 2026. Generasi video juga berkaitan dengan arah yang lebih canggih, yaitu “world model”.

DeepSeek pada awalnya tidak banyak berinvestasi pada generasi multimodal, karena menurut Liang Wenfeng generasi multimodal bukanlah jalur utama kecerdasan.

Dalam arah Agent, DeepSeek-V3.2 memperkuat kemampuan Agent, tetapi frekuensi iterasi keseluruhan DeepSeek lebih rendah daripada setelah R1. Pada satu waktu, mereka sempat merasa cemas karena ketertinggalan dari “anak harimau kecil” lainnya.

Sejak awal 2025 hingga sekarang, ZhiPu, MiniMax, dan Kimi masing-masing sudah memperbarui model sebanyak 5 versi, 4 versi, dan 3 versi—ditargetkan untuk penguatan Agent atau coding.

Menurut data OpenRouter, dalam 30 hari terakhir (24 Feb-26 Mar), di antara token usage untuk model yang dipanggil oleh aplikasi OpenClaw melalui OpenRouter, 10 teratas jumlah tokennya: 6 model berasal dari Tiongkok, sementara DeepSeek-V3.2 berada di peringkat ke-12. (Catatan: OpenRouter lebih mencerminkan situasi penggunaan personal dan pengembang skala kecil-menengah, sehingga hanya bisa dijadikan referensi untuk konsumsi token secara keseluruhan.)

Tujuan DeepSeek bukan yang paling mainstream; ada yang pergi, ada yang tinggal

“Keunikan” DeepSeek berkaitan dengan tujuan AGI yang diakui oleh Liang Wenfeng. Selain mengejar batas atas kecerdasan model besar, ada dua hal kerja yang ia anggap sangat penting:

Pertama, membuat model besar berbasis ekosistem lokal.

DeepSeek akan berinvestasi dalam adaptasi untuk GPU buatan lokal agar bisa menyelesaikan kenyataan bahwa pasokan GPU berperforma tinggi terbatas. Misalnya, setelah update V3.1 pada bulan Agustus tahun lalu, mereka menyebutkan bahwa DeepSeek menggunakan UE8M0 FP8—format kompresi data—yang “dirancang untuk chip domestik generasi berikutnya”. Penggantian Triton dengan TileLang open source buatan lokal yang disebut sebelumnya juga termasuk jenis pekerjaan ini: memberi kontrol yang lebih aktif pada lapisan dasar.

Saat berdiskusi dengan pelaku industri AI, Liang Wenfeng pernah menyampaikan hipotesis seperti ini: “Bisakah kita menggunakan sebagian dari kekuatan komputasi yang ada untuk mewujudkan semua kecerdasan seperti yang ada sekarang?”

Kedua, “inovasi bergaya orisinal”: melakukan beberapa arah yang tidak akan dicoba oleh perusahaan besar atau startup lain, dan juga tidak mau dicoba.

Misalnya, pada paruh kedua 2024, DeepSeek mulai seri Janus, mencoba menyeragamkan pemahaman dan generasi multimodal. DeepSeek juga pernah membuat seri Prover, mengeksplor pembuktian formal. Ada juga OCR pada 25 tahun, serta eksplorasi continual learning dan “membiake otak manusia” yang sedang berjalan di internal.

Sebagai pendiri, yang paling ia pedulikan bukan hanya efek model itu sendiri, tetapi juga penemuan yang lebih mendasar dan orisinal di sepanjang perjalanan mengejar efek tersebut.

Namun hal ini tidak sepenuhnya cocok dengan sebagian ekspektasi pihak luar terhadap DeepSeek: ada orang yang berharap setiap kali DeepSeek bergerak hasilnya bisa setajam R1—terobosan besar yang mengejutkan. Hal itu agak sulit dan tidak sesuai dengan pola perkembangan teknis.

Liang Wenfeng mungkin tidak peduli dengan ekspektasi eksternal, tapi ia harus menghadapi dan menangani ekspektasi internal.

Bagi lebih banyak peneliti muda, melakukan riset yang lebih terdepan juga berarti harus menanggung lebih banyak ketidakpastian. Jalan yang lebih aman adalah terus terlibat dalam model-model paling kuat di industri, mencantumkan nama di laporan teknis yang banyak diperhatikan, serta didukung oleh sumber daya GPU yang melimpah untuk eksperimen dan eksplorasi.

Selain kehormatan dan pengaruh, daya tarik bagi anggota DeepSeek di mata dunia luar juga termasuk janji kekayaan yang besar.

Gaji mutlak DeepSeek tidak rendah, tetapi di luar ada yang lebih tinggi. Beberapa headhunter memberi tahu kami bahwa kompetitor memberikan “angka yang sulit ditolak”, “kenaikan 2 sampai 3 kali bukan masalah”, dan “total paket perusahaan lain menawarkan angka delapan (berupa saham atau opsi)”.

Perubahan terbaru juga adalah MiniMax dan ZhiPu yang go public dan harga sahamnya naik; IPO Kimi juga masuk agenda. Hal ini membuat beberapa anggota DeepSeek semakin punya pertanyaan tentang opsi yang mereka pegang, yang tidak memiliki harga yang jelas.

Menghadapi tawaran besar semacam itu, lebih banyak orang memilih bertahan. Mereka mengakui cara Liang Wenfeng mengejar AGI, bersedia melakukan eksplorasi yang tidak didorong oleh persaingan semata; juga sudah terbiasa dengan suasana penelitian DeepSeek yang relatif longgar dan tenang.

Beberapa rumor dari luar baru-baru ini tidak akurat. Tim DeepSeek mengalami perubahan, tetapi tidak terjadi “kepergian massal dalam kelompok”.

“Orang-orang yang tinggal tetap agak idealis.” Demikian kata seseorang yang dekat dengan DeepSeek. Liang Wenfeng merasa bahwa di luar jalur utama untuk meningkatkan efisiensi dan performa model, perlu ada beberapa arah yang balasannya saat ini tidak jelas. Karena “di negara lain, perusahaan-perusahaan dengan komputasi lebih banyak seperti Google, OpenAI, pasti mencoba berbagai arah di dalam.”

Sampai sekarang, tim DeepSeek yang relatif kecil dan sejak didirikan suasana yang transparan serta datar membuat pembagian kerja di antara anggota masih bisa terjadi secara alami: kadang memulai arah baru karena ada tiga atau lima orang yang merasa sebuah idea bagus, lalu mereka bersama-sama mengerjakannya.

Ini sejalan dengan deskripsi Liang Wenfeng ketika ia menerima wawancara 《暗涌》 pada 2024: “Kami biasanya tidak mendahulukan pembagian kerja.” “Setiap orang punya riwayat pertumbuhan yang unik, semua membawa ide sendiri; tidak perlu mendorongnya… Namun ketika sebuah idea menunjukkan potensi, kami juga akan mengalokasikan sumber daya dari atas ke bawah.”

“DeepSeek adalah tempat yang benar-benar ingin melakukan riset; di Tiongkok, bahkan di dunia, sulit menemukan tempat yang lebih baik.” kata seseorang yang dekat dengan DeepSeek.

Mengubah dunia, sekaligus diubah oleh dunia

Pemahaman unik dan pemecahan tujuan AGI adalah hal berharga milik DeepSeek, sekaligus menjadi alasan mengapa kini ia menghadapi ketegangan internal. Karena ekosistem yang dibangun dan eksplorasi orisinal yang dinilai oleh Liang Wenfeng, tumpang tindih dengan target industri yang secara umum menganggap “tetap paling kuat” sebagai prioritas nomor satu, tetapi tidak sepenuhnya sama.

Selain itu, setelah perkembangan model besar sampai sejauh ini, standar tentang “kuat” dan “orisinalitas” semakin kabur dan sangat subjektif.

Skor benchmark sudah tidak bisa sepenuhnya mengukur level model. Terutama setelah masuk ke kompetisi model Agentic, jangkauan produk yang menyentuh dunia nyata—beserta case penggunaan long-tail yang dibawanya dan data yang beragam—menjadi semakin penting, dan justru bagian yang sebelumnya tidak banyak diinvestasikan oleh DeepSeek yang fokus pada riset model.

V4 yang akan segera dirilis, kemungkinan masih akan menjadi open source model terkuat, tetapi sulit menjadi yang benar-benar menindas (overwhelmingly) dalam hal kekuatan. Karena saat ini, di berbagai skenario, standar dan “rasa” tentang “kuat” bagi pengembang dan pengguna yang berbeda semakin beragam.

Apa itu eksplorasi baru yang orisinal dan bernilai, juga selalu berbeda pendapat; bergantung pada pengalaman, penilaian, dan intuisi peneliti yang berbeda—yang disebut “selera teknis” (technical taste).

Cara memverifikasi selera adalah melalui eksperimen, namun jumlah dan skala eksperimen dibatasi oleh sumber daya GPU. Dibandingkan rekan sejawat, DeepSeek tidak punya cukup komputasi.

Terakhir, baik dalam fondasi ekosistem model besar maupun dalam proses mengejar performa model dengan mengeksplor arah yang mungkin tidak akan dicoba oleh tim lain, imbal balik dari pekerjaan yang dinilai oleh Liang Wenfeng ini semuanya sangat tidak jelas.

Riset terdepan seharusnya menanggung ketidakpastian semacam ini, tetapi kenyataan bahwa sumber daya komputasi terbatas, serta ekspektasi dari pihak luar bahwa DeepSeek bisa terus mengejutkan bahkan “menindas” (碾压), tidak sepenuhnya cocok.

Liang Wenfeng menyadari perlu ada perubahan. Baru-baru ini ia mulai mencari cara untuk memberi valuasi kepada perusahaan, dan memberi ekspektasi yang lebih pasti bagi anggota tim.

DeepSeek juga akan lebih banyak berinvestasi pada produk. Kami merangkum seluruh pengumuman rekrutmen yang dipublikasikan oleh seorang HR DeepSeek di media sosial dari Desember 2024 hingga sekarang. Pada rekrutmen terbaru di pertengahan Maret tahun ini, DeepSeek untuk pertama kalinya menyebut nama produk lain yang spesifik. Mereka merekrut posisi “model strategy product manager” untuk arah Agent:

Terus memantau tren paling baru industri, akrab serta menggunakan secara mendalam agent-agent terkenal seperti Claude Code, OpenClaw, Manus, dan lainnya……

Berikutnya, pasti akan terlihat lebih banyak langkah yang dilakukan DeepSeek di produk Agent.

Pada awal 2025, dengan semangat open source yang murah hati dan keajaiban dari kecil mengalahkan yang besar, DeepSeek mengguncang Tiongkok dan dunia serta mengubah dunia: membuat sejumlah rekan sejawat menginvestasikan lebih banyak energi pada teknologi model itu sendiri, menginspirasi model-model lanjutan seperti Kimi K2 dan K2-thinking, dan secara langsung juga memunculkan beberapa tim baru, seperti MiroMind yang didukung oleh Chen Tianqiao.

Mengapa ini disebut “keajaiban”, karena keajaiban adalah sesuatu yang jarang terjadi—peristiwa probabilitas kecil. Dalam lingkungan Tiongkok yang mengagungkan kompetisi dan hasil yang bicara, keberadaan DeepSeek yang berani mengejar tujuan yang unik adalah peristiwa probabilitas kecil yang menyenangkan.

Orang-orang yang berinteraksi dengan Liang Wenfeng menilai: “Dia orang yang sangat tahan terhadap kebisingan.”

Setelah R1 meledak pada 2025, Liang Wenfeng menunjukkan sikap yang tenang terhadap kepopuleran. Tapi sekarang ia menghadapi ujian dalam situasi yang berbeda: ketika kompetisi eksternal makin ketat, ia perlu membedakan kebisingan dan sinyal, berpegang pada hal-hal yang harus dipertahankan, serta mengubah hal-hal yang memang harus diubah.

“Orang yang menunduk mengerjakan tugas mungkin tidak selalu bisa tertawa paling akhir di tengah arus pasar yang gempar dan dangkal, tetapi hanya dengan munculnya lebih banyak perusahaan seperti DeepSeek, teknologi Tiongkok akan punya kemungkinan untuk beralih dari ‘meniru’ ke ‘memimpin’.” kata seseorang yang bekerja di industri tersebut.

Ini adalah pekerjaan milik Liang Wenfeng dan DeepSeek. Dan bagi lebih banyak orang yang pernah diguncang oleh perusahaan ini, yang bisa mereka lakukan sangat sederhana: lepaskan narasi artikel viral (爽文) itu, gunakan lebih banyak ketenangan dalam pikiran untuk melihat sebuah perusahaan dan inovasi teknologi.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.