Come Zhang Yiming e ByteDance hanno combinato algoritmi di raccomandazione e logistica dei contenuti per scalare TikTok/Douyin in un motore globale dell'attenzione.

Zhang Yiming (nato nel 1983) è noto soprattutto come fondatore di ByteDance, ma la sua storia parla meno di imprenditorialità da celebrità e più di una precisa convinzione di prodotto.
Dopo gli studi all'Università di Nankai (passando dalla microelettronica al software), ha ricoperto ruoli che l'hanno esposto a search, feed e internet consumer su larga scala: ha lavorato alla startup di ricerca viaggi Kuxun, una breve esperienza in Microsoft China, e poi ha fondato un primo prodotto immobiliare, 99fang.
La domanda centrale di Zhang era semplice: come abbinare rapidamente la giusta informazione alla giusta persona, senza chiedere loro troppo lavoro?
I prodotti internet precedenti assumevano che gli utenti cercassero o seguissero portali e categorie. Ma con l'esplosione dei contenuti, il collo di bottiglia è passato da “non abbastanza informazione” a “troppa informazione”. La sua tesi di prodotto era che il software dovesse fare più filtraggio—e farlo continuamente—così l'esperienza migliorasse a ogni interazione.
Sin dall'inizio, ByteDance ha trattato la personalizzazione come una primitiva di prodotto di prima classe, non come una funzione da aggiungere dopo. Questo approccio si riflette in tre scelte ricorrenti:
Questa è un'analisi dei meccanismi, non della mitologia: come algoritmi di raccomandazione, design del prodotto e “logistica dei contenuti” lavorano insieme—e cosa significa questo per creator, inserzionisti e sicurezza a scala globale.
ByteDance non è nata con il video breve. È partita da una domanda più semplice: come aiutare le persone a trovare informazioni utili e interessanti quando ce n'è troppo?
I primi prodotti di Zhang Yiming erano app di notizie e informazione progettate per imparare cosa interessava a ciascun utente e riordinare il feed di conseguenza.
Il prodotto di rottura iniziale fu Toutiao (un'app di “headlines”). Invece di chiedere agli utenti di seguire editori o amici, trattava i contenuti come inventario e il feed come una vetrina personalizzata.
Questa impostazione era importante perché costrinse l'azienda a costruire presto la macchina centrale: taggare i contenuti, classificarli e misurare la soddisfazione in tempo reale.
La maggior parte delle app consumer dell'epoca si affidava al grafo sociale—ciò che vedi dipende da chi conosci. ByteDance puntò sul grafo di interessi—ciò che guardi, salti, leggi, condividi e cerchi determina cosa vedi dopo.
Questa scelta rese il prodotto meno dipendente dagli effetti di rete al lancio e più dipendente dal rendere le raccomandazioni “abbastanza buone” in fretta.
Fin dall'inizio, ByteDance ha trattato le decisioni di prodotto come ipotesi. Funzionalità, layout e aggiustamenti di ranking venivano testati continuamente e le varianti vincenti venivano rilasciate rapidamente.
Non si trattava solo di A/B testing come strumento; era un sistema di gestione che premiava la velocità di apprendimento.
Quando il motore di raccomandazione funzionò per gli articoli, passare a formati più ricchi fu un passaggio naturale. Il video offriva segnali di feedback più chiari (tempo di visualizzazione, rivedere, completamento), un consumo più rapido dei contenuti e un potenziale maggiore se il feed restava coerentemente rilevante—preparando il terreno per Douyin e, più tardi, TikTok.
Per gran parte della storia dei media, il problema era la scarsità: non c'erano abbastanza canali, editori o creator per riempire ogni nicchia. La distribuzione era semplice—accendi la TV, leggi il giornale, visita qualche sito web—e il “miglior” contenuto era ciò che superava i gate limitati.
Ora il collo di bottiglia si è invertito. Ci sono più contenuti di quanti ne possa valutare una persona, anche in una singola categoria. Questo significa che “troppi contenuti” è meno un problema di creazione e più un problema di distribuzione: il valore si sposta dal produrre più post all'aiutare il giusto spettatore a trovare la cosa giusta rapidamente.
I feed cronologici presumono che tu sappia già chi seguire. Sono ottimi per tenersi aggiornati con amici o un piccolo gruppo di creator, ma fanno fatica quando:
La scoperta basata sui follower favorisce anche gli incumbent. Una volta che pochi account catturano l'attenzione all'inizio, la crescita diventa più difficile per tutti—indipendentemente dalla qualità.
Quando i contenuti abbondano, le piattaforme hanno bisogno di segnali che separino “visto” da “piaciuto”. Il tempo di visualizzazione conta, ma non è l'unico indizio. Tasso di completamento, rivedere, pause, condivisioni e azioni "non interessato" aiutano a distinguere la curiosità dalla soddisfazione.
In un modello broadcast, scalare significa spingere un hit verso milioni. In un modello personalizzato, scalare significa consegnare milioni di piccoli "hit" diversi ai micro-pubblici giusti.
La sfida non è la portata—è la rilevanza a velocità, ripetutamente, per ogni persona.
I feed di ByteDance (Douyin/TikTok) sembrano magici perché imparano in fretta. Ma l'idea centrale è semplice: il sistema fa ripetutamente un'ipotesi su cosa ti piacerà, osserva cosa fai dopo e aggiorna la prossima ipotesi.
Pensa al feed come a un negozio con milioni di articoli.
Generazione dei candidati è la fase della “shortlist”. Dal catalogo enorme, il sistema estrae qualche centinaio o migliaio di video che potrebbero essere adatti a te. Usa indizi ampi: lingua, posizione, dispositivo, account che segui, argomenti con cui ti sei impegnato e ciò che hanno gradito spettatori simili.
Ranking è la fase dell'“ordinamento finale”. Dalla shortlist, predice quali video è più probabile che guarderai e apprezzerai adesso, e li ordina di conseguenza. Anche piccole differenze contano: scambiare due video può cambiare cosa guardi dopo, e questo cambia ciò che il sistema impara.
L'algoritmo non legge la mente—legge il comportamento. I segnali comuni includono:
Importante: impara anche le preferenze “negative”: cosa salti, silenzi o marchi come non interessato.
Per un nuovo utente, il sistema parte con scelte sicure e diverse: contenuti popolari nella tua regione e lingua, più una miscela di categorie—per rilevare rapidamente le preferenze.
Per un nuovo video, spesso si fa una “prova” controllata: mostrarglielo a piccoli gruppi probabili e ampliare la distribuzione se l'engagement è forte. È così che creator sconosciuti possono emergere senza un pubblico esistente.
I video brevi producono molti feedback in pochi minuti: molte visualizzazioni, molti swipe, molti completamenti. Questo flusso denso di segnali aiuta il modello ad aggiornarsi rapidamente, stringendo il loop tra “test” e “apprendimento”.
ByteDance può eseguire A/B test dove gruppi diversi vedono regole di ranking leggermente differenti (per esempio, dare più peso alle condivisioni rispetto ai like). Se una variante migliora risultati significativi—come soddisfazione e tempo ben speso—diventa il nuovo default, e il ciclo continua.
Il feed di ByteDance è spesso descritto come “addictive”, ma ciò che succede davvero è un sistema di feedback che si compone. Ogni swipe è sia una scelta sia una misurazione.
Quando guardi, salti, metti like, commenti, rivedi o condividi, generi segnali che aiutano il sistema a indovinare cosa mostrarti dopo.
Una singola visualizzazione non è molto informativa da sola. Ma milioni di piccole azioni—soprattutto pattern ripetuti—creano un quadro chiaro di ciò che tende a trattenere la tua attenzione. La piattaforma usa quei segnali per:
Questa è la ruota: engagement → miglior abbinamento → più engagement. Man mano che l'abbinamento migliora, gli utenti passano più tempo; il tempo extra produce più dati; i dati migliorano di nuovo l'abbinamento.
Se il sistema inseguisse solo “più di ciò che ha funzionato”, il tuo feed diventerebbe ripetitivo in fretta. Per questo i sistemi di raccomandazione includono deliberatamente esplorazione—mostrando contenuti nuovi, adiacenti o incerti.
L'esplorazione può essere:
Ben fatta, mantiene il feed fresco e aiuta gli utenti a scoprire cose che non sapevano cercare.
Una ruota può girare nella direzione sbagliata. Se il modo più semplice per catturare attenzione è il sensazionalismo, l'odio o il contenuto estremo, il sistema può sovra-premiarlo. Si formano filter bubble quando la personalizzazione diventa troppo ristretta.
Le piattaforme bilanciano soddisfazione e novità con una combinazione di regole di diversità, soglie di qualità dei contenuti e politiche di sicurezza (affrontate più avanti), oltre a controlli di ritmo così che i contenuti ad alto arousal non dominino ogni sessione.
Quando si parla di ByteDance, di solito si indica l'algoritmo di raccomandazione. Ma c'è un sistema più silenzioso che fa altrettanto lavoro: la logistica dei contenuti—il processo end-to-end che porta un video dal telefono del creator allo schermo del giusto spettatore, rapidamente, in sicurezza e ripetutamente.
Pensalo come una catena di fornitura per l'attenzione. Invece di magazzini e camion, il sistema gestisce:
Se un passaggio è lento o inaffidabile, l'algoritmo ha meno materiale su cui lavorare—e i creator perdono motivazione.
Un feed performante ha bisogno di un flusso costante di "inventario" fresco. I prodotti in stile ByteDance aiutano i creator a produrre più spesso abbassando lo sforzo di produzione: template in-app, effetti, spezzoni musicali, scorciatoie di editing e prompt guidati.
Non sono solo funzionalità divertenti. Standardizzano i formati (durata, rapporto d'aspetto, ritmo) e rendono i video più facili da completare, aumentando la frequenza di pubblicazione e rendendo le performance più comparabili.
Dopo l'upload, i video devono essere processati in risoluzioni e formati multipli così da riprodursi fluidamente su dispositivi e condizioni di rete diverse.
La velocità di processo conta perché:
L'affidabilità protegge anche la "sessione". Se la riproduzione balbetta, gli utenti smettono di scorrere e il loop di feedback si indebolisce.
A scala, la moderazione non è una singola decisione—è un workflow. La maggior parte delle piattaforme usa step stratificati: rilevamento automatico (spam, nudità, violenza, audio protetto da copyright), scoring del rischio e revisione umana mirata per i casi limite e le appellazioni.
Le regole funzionano solo se implementate coerentemente: policy chiare, formazione dei revisori, tracce di audit, percorsi di escalation e misurazione (falsi positivi, tempi di turnaround, recidiva). In altre parole, l'enforcement è un sistema operativo—che deve evolversi veloce quanto i contenuti.
Il vantaggio di ByteDance non è solo “l'algoritmo”. È il modo in cui il prodotto è costruito per generare i segnali giusti per il feed—e per mantenerli.
Un buon sistema di raccomandazione ha bisogno di offerta costante. TikTok/Douyin riducono l'attrito con una camera sempre pronta, trimming semplice, template, filtri e una vasta libreria sonora.
Due dettagli di design contano:
Più creator che postano più spesso significa più variazione da testare per il feed—e più possibilità di trovare l'abbinamento.
Il player a schermo intero rimuove elementi UI concorrenti e incoraggia un'azione chiara: swipe. L'audio attivo di default aumenta l'impatto emotivo e rende le tendenze portabili (un suono diventa un riferimento condiviso).
Questo design migliora anche la qualità dei dati. Quando ogni swipe è un segnale forte sì/no, il sistema può imparare più in fretta rispetto a interfacce affollate dove l'attenzione è divisa.
I formati di remix trasformano la “creazione” in “risposta”. Questo conta perché le risposte ereditano contesto:
In pratica, il remix è distribuzione incorporata—senza bisogno di follower.
Le notifiche possono riaprire il loop (nuovi commenti, post di creator, eventi live). Streaks e meccaniche simili possono aumentare la retention, ma possono anche spingere verso controlli compulsivi.
Una lezione di prodotto utile: favorire prompt significativi (risposte, follow che hai chiesto) rispetto a prompt di pressione (paura di perdere una streak).
Piccole scelte—play istantaneo, caricamento minimo, un gesto primario—fanno sembrare il feed raccomandato il modo predefinito di esplorare.
Il prodotto non si limita a mostrarti contenuti; sta allenando un comportamento ripetuto: apri app → guarda → swipe → affina.
ByteDance non ha “solo tradotto un'app” e l'ha chiamata internazionale. Ha trattato la globalizzazione come un problema di prodotto e di sistema operativo allo stesso tempo: ciò che piace è intensamente locale, ma la macchina che lo consegna deve essere coerente.
La localizzazione inizia dalla lingua, ma rapidamente passa al contesto—meme, musica, umorismo e cosa conta come “buon” ritmo in un video.
Le comunità locali di creator contano: la crescita iniziale spesso dipende da un piccolo gruppo di creator nativi che impostano il tono che gli altri imitano.
I team tipicamente localizzano:
Con l'aumentare dell'uso, il feed diventa un'operazione logistica. Team regionali gestiscono partnership (label, leghe sportive, media), programmi per creator e enforcement delle policy che riflettono le leggi locali.
La moderazione scala a strati: filtri proattivi, segnalazioni degli utenti e revisione umana. L'obiettivo è velocità e coerenza—rimuovere violazioni chiare rapidamente e gestire i casi limite con competenza locale.
Andare globali significa convivere con regole degli store e vincoli dei dispositivi. Gli aggiornamenti possono essere ritardati dalle revisioni, le feature possono variare per regione e i telefoni economici impongono scelte difficili su qualità video, caching e uso dati.
La distribuzione non è un appunto di marketing; plasma ciò che il prodotto può fare in modo affidabile.
Le tendenze possono apparire e sparire in giorni, mentre la scrittura delle policy e la formazione degli enforcement impiegano settimane. I team colmano il divario con “regole temporanee” per formati emergenti, linee guida di enforcement rapide e monitoraggio serrato durante momenti volatili—poi convertono ciò che ha funzionato in policy e tooling duraturi.
Per ulteriori dettagli su come il feed è supportato dietro le quinte, vedi l'articolo del blog sulla logistica dei contenuti.
Il feed di ByteDance è spesso descritto come un “algoritmo”, ma si comporta più come un marketplace. Gli spettatori portano domanda (attenzione). I creator forniscono l'inventario (video). Gli inserzionisti finanziano il sistema pagando per accedere a quell'attenzione—quando può essere raggiunta in modo prevedibile e sicuro.
I creator non si limitano a caricare contenuti; producono la materia prima che il sistema di raccomandazione può testare, distribuire e imparare da.
Un flusso costante di post freschi dà alla piattaforma più “esperimenti” da eseguire: argomenti diversi, hook, formati e pubblici.
In cambio, le piattaforme offrono incentivi che modellano il comportamento:
I brand solitamente vogliono risultati ripetibili più che fortuna virale:
La raccomandazione permette alle comunità di nicchia di prosperare senza grandi numeri di follower. Allo stesso tempo, può concentrare rapidamente l'attenzione su tendenze di massa quando molti spettatori rispondono in modo simile.
Questa dinamica crea una tensione strategica per i creator: il contenuto di nicchia costruisce fedeltà; partecipare alle tendenze può aumentare la portata.
Poiché la distribuzione è basata sulle performance, i creator ottimizzano per segnali che il sistema legge in fretta: aperture forti, formati chiari, comportamento seriale e pubblicazione coerente.
Premia anche i contenuti "leggibili"—argomenti ovvi, audio riconoscibile e template ripetibili—perché è più facile abbinarli ai giusti spettatori su scala.
Il superpotere di ByteDance—ottimizzare i feed per l'engagement—genera una tensione intrinseca. Gli stessi segnali che dicono a un sistema “le persone non riescono a smettere di guardare questo” non dicono automaticamente “questo è utile per loro”. A piccola scala è un problema di UX. A scala TikTok/Douyin diventa un problema di fiducia.
I sistemi di raccomandazione imparano da ciò che gli utenti fanno, non da ciò che poi vorrebbero non aver fatto. Replay veloci, lungo tempo di visione e scorrimenti notturni sono facili da misurare. Rimorso, ansia e uso compulsivo sono più difficili.
Se un feed è sintonizzato solo sull'engagement misurabile, può sovra-premiare contenuti che scatenano rabbia, paura o ossessione.
Alcuni rischi prevedibili emergono attraverso i mercati:
Nessuno di questi richiede "attori malintenzionati" dentro l'azienda; possono emergere dall'ottimizzazione ordinaria.
La gente chiede spesso una spiegazione semplice: “Perché ho visto questo?” In pratica, il ranking mescola migliaia di feature (tempo di visualizzazione, skip, freschezza, contesto dispositivo, storia del creator) più esperimenti in tempo reale.
Anche se una piattaforma condividesse un elenco di fattori, non si mapperebbe facilmente a una singola ragione leggibile per un'impressione specifica.
La sicurezza non è solo moderazione ex-post. Può essere progettata nel prodotto e nelle operazioni: attrito per argomenti sensibili, controlli più forti per i minori, diversificazione per ridurre l'esposizione ripetuta, limiti su raccomandazioni notturne e strumenti chiari per resettare o regolare il feed.
Operativamente significa team di revisione ben formati, percorsi di escalation e KPI di sicurezza misurabili—non solo KPI di crescita.
Le policy su cosa è permesso, come funzionano le appellazioni e come viene auditato l'enforcement influenzano direttamente la fiducia. Se utenti e regolatori percepiscono il sistema come opaco o incoerente, la crescita diventa fragile.
L'attenzione sostenibile richiede non solo tenere le persone a guardare, ma guadagnarsi il permesso di presentarsi nella loro vita.
Il successo di ByteDance rende "raccomandazioni + rilascio veloce" una ricetta attraente. La parte trasferibile non è un singolo modello—è il sistema operativo intorno alla discovery: cicli di feedback stretti, misurazione chiara e investimento serio nella pipeline di contenuti che alimenta quei loop.
La iterazione rapida funziona se accompagnata da obiettivi misurabili e cicli di apprendimento brevi. Tratta ogni cambiamento come un'ipotesi, rilascia piccolo e leggi i risultati quotidianamente—non trimestralmente.
Concentra le metriche sul valore utente, non solo sul tempo speso. Esempi: “sessioni che finiscono con un follow”, “contenuti salvati/condivisi”, “soddisfazione rilevata con survey”, o “ritenzione dei creator”. Sono più difficili del semplice tempo di visione, ma guidano compromessi migliori.
L'ottimizzazione solo per l'engagement senza barriere. Se "più minuti" è il tabellone dei punteggi, finirai per premiare contenuti di bassa qualità, polarizzanti o ripetitivi perché sono affidabilmente appiccicosi.
Evita anche il mito che gli algoritmi eliminino la necessità del giudizio editoriale. I sistemi di discovery codificano sempre scelte: cosa potenziare, cosa limitare e come gestire i casi limite.
Inizia con vincoli, non slogan:
Le raccomandazioni dipendono dalla logistica dei contenuti: tool, workflow e controllo qualità. Investi presto in:
Se stai pianificando, valuta il sistema nel suo complesso—modelli, moderazione e supporto—prima di scalare (prezzi).
Una nota pratica per i team che costruiscono prodotti software: molti di questi investimenti di sistema (cruscotti, tool interni, app di workflow) sono semplici da prototipare velocemente se riesci ad accorciare il loop build–measure–learn. Piattaforme come Koder.ai possono aiutare qui permettendo ai team di "vibe-code" app web tramite un'interfaccia chat, poi esportare il codice sorgente o distribuire—utile per creare cruscotti di esperimenti, prototipi di code di moderazione o strumenti operativi dei creator senza aspettare un lungo ciclo di sviluppo tradizionale.
Per altri approfondimenti di product thinking come questo, vedi il blog.
La tesi di prodotto centrale di ByteDance si può riassumere in una semplice equazione:
algoritmi di raccomandazione + logistica dei contenuti + design del prodotto = un motore scalabile dell'attenzione.
L'algoritmo abbina le persone ai video probabilmente interessanti. Il sistema logistico assicura che ci sia sempre qualcosa da guardare (offerta, revisione, etichettatura, distribuzione, strumenti per creator). E il design del prodotto—riproduzione a schermo intero, segnali di feedback rapidi, creazione a bassa frizione—trasforma ogni visualizzazione in dati che migliorano la successiva.
Alcuni dettagli importanti rimangono poco chiari o difficili da verificare senza accesso interno:
Piuttosto che indovinare, tratta le affermazioni pubbliche (dalla compagnia, critici o commentatori) come ipotesi e cerca evidenze coerenti attraverso disclosure, ricerca e comportamento osservabile del prodotto.
Se vuoi approfondire senza entrare troppo nel tecnico, concentrati su:
Se tieni a portata di mano queste domande, potrai analizzare TikTok, Douyin e qualsiasi futuro prodotto basato su feed con occhi più lucidi.
La tesi di prodotto di Zhang Yiming era che il software dovrebbe filtrare continuamente le informazioni per te usando segnali di comportamento, in modo che l'esperienza migliori a ogni interazione. In un mondo di sovraccarico di contenuti, il compito del prodotto passa da «aiutami a trovare informazioni» a «decidi cosa è più rilevante in questo momento».
Un feed basato sul grafo sociale è guidato da chi segui; un feed basato sul grafo di interessi è guidato da ciò che fai (guardi, salti, rivedi, condividi, cerchi). L'approccio basato sugli interessi può funzionare anche quando non segui nessuno, ma dipende molto dall'avere raccomandazioni sufficientemente buone fin da subito e dall'imparare rapidamente dal comportamento.
La maggior parte dei feed fa due cose principali:
La generazione trova i "possibili"; il ranking decide l'ordine finale dove piccole differenze possono rimodellare cosa guarderai dopo.
I segnali forti provengono spesso dal comportamento osservabile, in particolare:
Like e commenti contano, ma il comportamento di visione è spesso il più affidabile perché è più difficile da falsificare su larga scala.
Per i nuovi utenti, le piattaforme partono da scelte diverse e "sicure": contenuti popolari nella tua lingua/area e una miscela di categorie per rilevare rapidamente le preferenze. Per un nuovo video, spesso si esegue una distribuzione di prova controllata: mostrarlo a piccoli gruppi probabili e ampliare la portata se l'engagement è forte. In pratica, così i creatori senza pubblico possono emergere se le performance iniziali sono buone.
L'esplorazione evita che il feed diventi ripetitivo testando intenzionalmente contenuti nuovi o adiacenti. Tattiche comuni:
Senza esplorazione, il sistema può adattarsi troppo e creare loop ristretti che sembrano noiosi o polarizzati.
L'ottimizzazione fuori controllo si verifica quando il modo più semplice per catturare attenzione è il sensazionalismo o il contenuto estremo, così l'algoritmo lo premia involontariamente. Le piattaforme contrastano questo con regole di diversità, soglie di qualità e politiche di sicurezza, oltre a controlli di pacing che impediscono ai contenuti ad alto arousal di dominare ogni sessione.
La logistica dei contenuti è la pipeline end-to-end che porta un video dal telefono del creator allo schermo del giusto spettatore:
Se questa pipeline è lenta o inaffidabile, le raccomandazioni soffrono perché il sistema ha meno inventario (o inventario di qualità inferiore) e loop di feedback più deboli.
Gli strumenti che riducono l'attrito (template, effetti, librerie sonore, editing semplice) aumentano la frequenza di pubblicazione e standardizzano i formati, rendendo i video più facili da completare e confrontare. I formati di remix (duet/stitch) funzionano come distribuzione incorporata agganciando nuovo contenuto a clip già provate: il creator originale beneficia della circolazione e il sistema ottiene segnali più chiari sui grafi di interesse.
La cultura dell'esperimentazione trasforma le decisioni di prodotto in ipotesi misurabili. I team rilasciano piccoli cambiamenti (UI, pesi di ranking, notifiche), misurano l'impatto e adottano rapidamente le varianti vincenti. Per essere responsabili, usare metriche oltre al tempo di visione (per esempio: soddisfazione, salvataggi/condivisioni, tasso "non interessato", tasso di reclami) così la crescita non avviene a costo del benessere degli utenti.