Como Zhang Yiming e a ByteDance combinaram algoritmos de recomendação e logística de conteúdo para escalar o TikTok/Douyin em um motor global de atenção.

Zhang Yiming (nascido em 1983) é mais conhecido como o fundador da ByteDance, mas sua história é menos sobre empreendedorismo celebridade e mais sobre uma crença específica de produto.
Depois de estudar na Universidade de Nankai (indo de microeletrônica para software), ocupou posições que o expuseram a busca, feeds e escala na internet de consumo: trabalhou na startup de busca de viagens Kuxun, teve uma breve passagem pela Microsoft China e então fundou um produto inicial de imóveis, o 99fang.
A pergunta central de Zhang era simples: como combinar a informação certa com a pessoa certa rapidamente, sem pedir que ela faça muito esforço?
Produtos da internet anteriores presumiam que os usuários iriam buscar ou seguir portais e categorias. Mas conforme o conteúdo explodiu, o gargalo mudou de “informação insuficiente” para “informação demais”. Sua tese de produto era que o software deveria fazer mais da filtragem—e fazê-la continuamente—para que a experiência melhore a cada interação.
Desde o início, a ByteDance tratou a personalização como um primitivo de produto de primeira classe, não como um recurso adicionado depois. Essa mentalidade aparece em três escolhas recorrentes:
Esta é uma análise de mecanismos, não de mitologia: como algoritmos de recomendação, design de produto e “logística de conteúdo” funcionam juntos—e o que isso significa para criadores, anunciantes e segurança em escala global.
A ByteDance não começou com vídeo curto. Começou com uma pergunta mais simples: como ajudar as pessoas a encontrar informação útil quando existe conteúdo demais?
Os produtos iniciais de Zhang Yiming eram apps de notícias e informação projetados para aprender com o que cada usuário se importava e reordenar o feed adequadamente.
O produto inicial de destaque foi o Toutiao (um app de "manchetes"). Em vez de pedir que os usuários seguissem publishers ou amigos, ele tratava o conteúdo como inventário e o feed como uma vitrine personalizada.
Esse enquadramento importou porque forçou a empresa a construir a maquinaria central cedo: etiquetar conteúdo, ranqueá-lo e medir satisfação em tempo real.
A maioria dos apps de consumo da época contava com um grafo social—quem você conhece determina o que você vê. A ByteDance apostou em um grafo de interesses—o que você assiste, pula, lê, compartilha e pesquisa determina o que aparece a seguir.
Essa escolha tornou o produto menos dependente de efeitos de rede no lançamento e mais dependente de conseguir recomendações “boas o suficiente” rapidamente.
Desde o começo, a ByteDance tratou decisões de produto como hipóteses. Recursos, layouts e ajustes de ranqueamento eram testados continuamente, e variantes vencedoras eram lançadas rápido.
Isso não era apenas A/B testing como ferramenta; era um sistema de gestão que recompensava a velocidade de aprendizado.
Uma vez que o motor de recomendação funcionou com artigos, migrar para formatos mais ricos foi um passo natural. Vídeo oferecia sinais de feedback mais claros (tempo de visualização, replays, conclusão), consumo mais rápido de conteúdo e um upside maior se o feed conseguisse se manter consistentemente relevante—preparando o terreno para Douyin e, mais tarde, TikTok.
Durante grande parte da história dos media, o problema era escassez: não havia canais, publishers ou criadores suficientes para preencher cada nicho. A distribuição era simples—ligar a TV, ler o jornal, visitar alguns sites—e o “melhor” conteúdo era o que passava por portões limitados.
Agora o gargalo virou. Há mais conteúdo do que qualquer pessoa consegue avaliar, mesmo em uma única categoria. Isso significa que “conteúdo demais” é menos um problema de criação e mais um problema de distribuição: o valor muda de produzir mais posts para ajudar o espectador certo a encontrar a coisa certa rapidamente.
Feeds cronológicos pressupõem que você já sabe quem seguir. Funcionam bem para acompanhar amigos ou um conjunto pequeno de criadores, mas têm dificuldade quando:
A descoberta baseada em seguidores também favorece incumbentes. Uma vez que algumas contas capturam atenção cedo, o crescimento fica mais difícil para todo mundo—independente da qualidade.
Quando o conteúdo é abundante, as plataformas precisam de sinais que separem “visto” de “gostado”. Tempo gasto importa, mas não é a única pista. Taxa de conclusão, reassistidas, pausas, compartilhamentos e ações de “não interessado” ajudam a distinguir curiosidade de satisfação.
Em um modelo de transmissão, escalar significa empurrar um hit para milhões. Em um modelo personalizado, escalar significa entregar milhões de “pequenos hits” diferentes para micro-audiências certas.
O desafio não é alcance—é relevância em velocidade, repetidamente, para cada pessoa.
Os feeds da ByteDance (Douyin/TikTok) parecem mágicos porque aprendem rápido. Mas a ideia central é simples: o sistema faz repetidamente um palpite sobre o que você vai gostar, observa o que você faz a seguir e atualiza o próximo palpite.
Pense no feed como uma loja com milhões de itens.
Geração de candidatos é a etapa da “lista curta”. Do enorme catálogo, o sistema puxa algumas centenas ou milhares de vídeos que podem se encaixar. Usa pistas amplas: seu idioma, localização, dispositivo, contas que você segue, tópicos com os quais interagiu e o que espectadores semelhantes curtiram.
Rankeamento é a etapa da “ordem final”. Da lista curta, ele prevê quais vídeos você tem maior probabilidade de assistir e gostar agora e os ordena de acordo. Pequenas diferenças importam aqui: trocar dois vídeos pode mudar o que você vê a seguir, e isso altera o que o sistema aprende.
O algoritmo não lê mentes—lê comportamento. Sinais comuns incluem:
Importante: ele também aprende preferências “negativas”: o que você consistentemente pula, silencia ou marca como não interessado.
Para um novo usuário, o sistema começa com escolhas seguras e diversas—conteúdo popular na sua região e idioma, mais uma mistura de categorias—para detectar preferências rapidamente.
Para um novo vídeo, frequentemente há um “teste controlado”: mostrá‑lo a pequenos grupos provavelmente interessados e expandir a distribuição se o engajamento for forte. É assim que criadores desconhecidos podem se destacar sem audiência prévia.
Vídeos curtos geram muitos sinais em minutos: muitas visualizações, muitos swipes, muitas conclusões. Esse fluxo denso de sinais ajuda o modelo a atualizar rapidamente, fechando o ciclo entre “teste” e “aprendizado”.
A ByteDance pode rodar A/B tests onde grupos diferentes veem regras de ranqueamento ligeiramente distintas (por exemplo, dando mais peso a compartilhamentos do que a curtidas). Se uma versão melhora resultados significativos—como satisfação e tempo bem gasto—ela vira o novo padrão, e o ciclo continua.
O feed da ByteDance é frequentemente descrito como “viciantes”, mas o que realmente acontece é um sistema de feedback que se compõe. Cada swipe é ao mesmo tempo uma escolha e uma medição.
Quando você assiste, pula, curte, comenta, reassiste ou compartilha, está gerando sinais que ajudam o sistema a adivinhar o que mostrar a seguir.
Uma única visualização não é muito informativa por si só. Mas milhões de pequenas ações—especialmente padrões repetidos—cri am uma imagem clara do que tende a prender sua atenção. A plataforma usa esses sinais para:
Esse é o flywheel: engajamento → melhor combinação → mais engajamento. Conforme a combinação melhora, os usuários passam mais tempo; o tempo extra produz mais dados; os dados aprimoram a combinação novamente.
Se o sistema só perseguir “mais do que funcionou”, seu feed ficaria repetitivo rápido. Por isso a maioria dos sistemas de recomendação inclui exploração—mostrar conteúdo novo, adjacente ou incerto.
Exploração pode ser:
Feita bem, mantém o feed fresco e ajuda usuários a descobrir coisas que não sabiam procurar.
Um flywheel pode girar na direção errada. Se a maneira mais fácil de ganhar atenção for sensacionalismo, raiva ou conteúdo extremo, o sistema pode recompensar isso em excesso. Bolhas de filtro podem se formar quando a personalização fica estreita demais.
Plataformas normalmente equilibram satisfação e novidade com uma mistura de regras de diversidade, limiares de qualidade de conteúdo e políticas de segurança (cobertas mais adiante), além de controles de ritmo para que conteúdo de alta excitação não domine cada sessão.
Quando se fala da ByteDance, normalmente apontam para algoritmos de recomendação. Mas há um sistema mais silencioso fazendo tanto trabalho quanto: logística de conteúdo—o processo ponta-a-ponta de mover um vídeo do telefone do criador para a tela do espectador certo, rápido, seguro e repetidamente.
Pense nisso como uma cadeia de suprimentos para atenção. Em vez de armazéns e caminhões, o sistema gerencia:
Se qualquer etapa for lenta ou pouco confiável, o algoritmo tem menos com o que trabalhar—e os criadores perdem motivação.
Um feed de alto desempenho precisa de um fluxo constante de “inventário fresco”. Produtos no estilo ByteDance ajudam criadores a produzir com mais frequência reduzindo esforço de produção: templates no app, efeitos, trechos musicais, atalhos de edição e prompts guiados.
Esses recursos não são só diversão. Eles padronizam formatos (duração, proporção, ritmo) e tornam os vídeos mais fáceis de terminar, o que aumenta a frequência de postagem e facilita comparar desempenho.
Após o upload, os vídeos precisam ser processados em múltiplas resoluções e formatos para tocar bem em dispositivos e condições de rede variadas.
Processamento rápido importa porque:
Confiabilidade também protege a “sessão”. Se o playback engasga, usuários param de rolar, e o loop de feedback enfraquece.
Em escala, moderação não é uma decisão única—é um fluxo de trabalho. A maioria das plataformas usa passos em camadas: detecção automática (spam, nudez, violência, áudio com direitos autorais), pontuação de risco e revisão humana direcionada para casos de borda e apelos.
Regras só funcionam quando são aplicadas de forma consistente: políticas claras, treinamento de revisores, trilhas de auditoria, caminhos de escalonamento e medição (falsos positivos, tempo de resposta, reincidência).
Em outras palavras, a aplicação é um sistema operacional—um que precisa evoluir tão rápido quanto o conteúdo.
A vantagem da ByteDance não é só “o algoritmo”. É a forma como o produto é construído para gerar os sinais certos para o feed—e para manter esses sinais fluindo.
Um ótimo sistema de recomendação precisa de oferta constante. TikTok/Douyin reduzem fricção com câmera sempre pronta, recorte simples, templates, filtros e uma grande biblioteca sonora.
Dois detalhes de design importam:
Mais criadores postando com mais frequência significa mais variação para o feed testar—e mais chances de encontrar um encaixe.
O player em tela cheia remove elementos de UI concorrentes e incentiva uma ação clara: swipe. Som ligado por padrão aumenta o impacto emocional e torna tendências portáteis (um som vira referência compartilhada).
Esse design também melhora a qualidade dos dados. Quando cada swipe é um sinal forte de sim/não, o sistema aprende mais rápido do que em interfaces cluttered onde a atenção está dividida.
Formatos de remix transformam “criar” em “responder”. Isso importa porque as respostas herdam contexto:
Na prática, remixing é distribuição embutida—sem precisar de seguidores.
Notificações podem reabrir o ciclo (novos comentários, posts de criadores, eventos ao vivo). Streaks e mecânicas similares podem aumentar retenção, mas também podem empurrar para checagens compulsivas.
Uma lição útil de produto: prefira gatilhos significativos (respostas, follows que você pediu) em vez de gatilhos de pressão (medo de perder uma sequência).
Pequenas escolhas—playback instantâneo, carregamento mínimo, um único gesto primário—fazem do feed recomendado a forma padrão de exploração.
O produto não está apenas mostrando conteúdo; está treinando um comportamento repetido: abrir app → assistir → deslizar → refinar.
A ByteDance não “traduziu um app” e chamou de internacional. Tratou a globalização como um problema de produto e um problema de sistema operacional ao mesmo tempo: o que as pessoas gostam é intensamente local, mas a maquinaria que entrega isso tem que ser consistente.
Localização começa pelo idioma, mas rapidamente avança para contexto—memes, música, humor e o que conta como “bom” ritmo em um vídeo.
Comunidades locais de criadores importam: crescimento inicial frequentemente depende de um pequeno grupo de criadores nativos que definem o tom que outros copiam.
Times normalmente localizam:
Conforme o uso cresce, o feed vira operação logística. Times regionais cuidam de parcerias (gravadoras, ligas esportivas, mídia), programas para criadores e aplicação de políticas que reflitam a legislação local.
A moderação escala em camadas: filtros proativos, denúncias de usuários e revisão humana. O objetivo é velocidade e consistência—remover violações claras rápido enquanto trata casos de borda com expertise local.
Ir global significa viver dentro das regras das lojas de apps e das limitações de dispositivos. Atualizações podem ser retardadas por processos de revisão, recursos podem variar por região e celulares de baixa gama forçam escolhas difíceis sobre qualidade de vídeo, cache e uso de dados.
Distribuição não é um rodapé de marketing; ela molda o que o produto pode fazer de forma confiável.
Tendências podem surgir e desaparecer em dias, enquanto escrever políticas e treinar aplicação leva semanas. Times preenchem a lacuna com “regras temporárias” para formatos emergentes, orientação rápida de aplicação e monitoramento mais intenso durante momentos voláteis—depois convertem o que funcionou em política e ferramentas duráveis.
Para saber mais sobre como o feed é suportado por trás das cenas, veja /blog/content-logistics-hidden-system-behind-the-feed.
O feed da ByteDance é frequentemente descrito como um “algoritmo”, mas se comporta mais como um marketplace. Espectadores trazem demanda (atenção). Criadores fornecem o inventário (vídeos). Anunciantes financiam o sistema pagando pelo acesso a essa atenção—quando ela pode ser alcançada de forma previsível e segura.
Criadores não só fazem upload de conteúdo; eles produzem a matéria-prima que o sistema de recomendação pode testar, distribuir e aprender.
Um fluxo constante de posts frescos dá à plataforma mais “experimentos” a rodar: tópicos diferentes, ganchos, formatos e audiências.
Em troca, plataformas oferecem incentivos que moldam o comportamento:
Marcas normalmente se importam menos com sorte viral e mais com resultados repetíveis:
A recomendação permite que comunidades de nicho floresçam sem precisar de grandes contagens de seguidores. Ao mesmo tempo, pode concentrar rapidamente atenção em tendências de massa quando muitos espectadores respondem similarmente.
Essa dinâmica cria uma tensão estratégica para criadores: conteúdo de nicho pode construir lealdade; participar de tendências pode gerar picos de alcance.
Como a distribuição é baseada em desempenho, criadores otimizam sinais que o sistema lê rápido: aberturas fortes, formatos claros, comportamento em série e postagens consistentes.
Também recompensa conteúdo “legível”—tópicos óbvios, áudio reconhecível e templates repetíveis—porque é mais fácil casar com os espectadores certos em escala.
A superpotência da ByteDance—otimizar feeds para engajamento—cria uma tensão embutida. Os mesmos sinais que dizem a um sistema “as pessoas não conseguem parar de assistir” não dizem automaticamente “isso é bom para elas”. Em pequena escala, essa tensão parece uma questão de UX. Em escala TikTok/Douyin, vira uma questão de confiança.
Sistemas de recomendação aprendem com o que usuários fazem, não com o que depois gostariam de ter feito. Replays rápidos, longo tempo de visualização e rolar tarde da noite são fáceis de medir. Arrependimento, ansiedade e uso compulsivo são mais difíceis.
Se um feed for afinado apenas para engajamento mensurável, pode recompensar excessivamente conteúdo que provoca raiva, medo ou obsessão.
Alguns riscos previsíveis aparecem em vários mercados:
Nada disso requer “atores maliciosos” dentro da empresa; pode emergir de otimização ordinária.
Pessoas frequentemente pedem uma explicação simples: “Por que eu vi isso?” Na prática, o ranqueamento mistura milhares de features (tempo de visualização, pulos, frescor, contexto de dispositivo, histórico do criador) além de experimentos em tempo real.
Mesmo que uma plataforma compartilhe uma lista de fatores, ainda não mapeará limpamente para uma única razão legível por humanos para uma impressão específica.
Segurança não é só moderação reativa. Pode ser projetada no produto e nas operações: atrito para tópicos sensíveis, controles mais fortes para menores, diversificação para reduzir exposição repetida, limites em recomendações noturnas e ferramentas claras para resetar ou ajustar o feed.
Operacionalmente, significa times de revisão bem treinados, caminhos de escalonamento e KPIs de segurança mensuráveis—não apenas KPIs de crescimento.
Políticas sobre o que é permitido, como funcionam recursos de apelação e como a aplicação é auditada afetam diretamente a confiança. Se usuários e reguladores acharem o sistema opaco ou inconsistente, o crescimento fica frágil.
Atenção sustentável requer não só manter pessoas assistindo, mas ganhar permissão para continuar aparecendo na vida delas.
O sucesso da ByteDance faz “recomendações + entrega rápida” parecer uma receita simples. A parte transferível não é nenhum modelo único—é o sistema operacional em torno da descoberta: loops de feedback apertados, medição clara e investimento sério no pipeline de conteúdo que alimenta esses loops.
Iteração rápida funciona quando vem com metas mensuráveis e ciclos curtos de aprendizado. Trate cada mudança como hipótese, lance pequeno e leia resultados diariamente—não trimestralmente.
Foque métricas no valor do usuário, não só tempo gasto. Exemplos: “sessões que terminam com um follow”, “conteúdo salvo/compartilhado”, “satisfação em pesquisa” ou “retenção de criadores”. São métricas mais difíceis que tempo de visualização bruto, mas guiam trade-offs melhores.
Otimização apenas por engajamento sem salvaguardas. Se “mais minutos” for o placar, você acabará recompensando conteúdo de baixa qualidade, polarizador ou repetitivo porque é consistentemente pegajoso.
Também evite o mito de que algoritmos removem a necessidade de julgamento editorial. Sistemas de descoberta sempre codificam escolhas: o que impulsionar, o que limitar e como tratar casos extremos.
Comece com restrições, não slogans:
Recomendações dependem de logística de conteúdo: ferramentas, fluxos de trabalho e controle de qualidade. Invista cedo em:
Se estiver orçando, precifique o sistema inteiro—modelos, moderação e suporte—antes de escalar (/pricing).
Uma nota prática para times que constroem produtos de software: muitos desses investimentos “sistêmicos” (dashboards, ferramentas internas, apps de workflow) são simples de prototipar rápido se você encurt ar o ciclo build–measure–learn. Plataformas como Koder.ai podem ajudar aqui ao permitir que times vibrem código de web apps via interface de chat e depois exportem código-fonte ou deployem—útil para montar dashboards de experimentos, protótipos de filas de moderação ou ferramentas de operações de criadores sem esperar por um pipeline de desenvolvimento tradicional longo.
Para mais pensamento de produto como este, veja /blog.
A tese de produto central da ByteDance pode ser resumida em uma equação simples:
algoritmos de recomendação + logística de conteúdo + design de produto = um motor de atenção escalável.
O algoritmo combina pessoas com vídeos provavelmente interessantes. O sistema de logística garante que sempre haja algo para assistir (oferta, revisão, rotulagem, distribuição, ferramentas para criadores). E o design de produto—playback em tela cheia, sinais de feedback rápidos, criação de baixa fricção—transforma cada visualização em dado que melhora a próxima visualização.
Alguns detalhes importantes seguem incertos ou difíceis de verificar sem acesso interno:
Em vez de adivinhar, trate declarações públicas (da empresa, críticos ou comentaristas) como hipóteses e procure evidência consistente em divulgações, pesquisa e comportamento observável do produto.
Se quiser se aprofundar sem ficar excessivamente técnico, foque nestes tópicos:
Se você mantiver essas perguntas à mão, poderá analisar o TikTok, Douyin e qualquer futuro produto baseado em feed com mais clareza.
A tese de produto de Zhang Yiming era que o software deveria filtrar continuamente a informação para você, usando sinais de comportamento, para que a experiência melhore a cada interação. Em um mundo de excesso de conteúdo, o trabalho do produto muda de “me ajudar a encontrar informação” para “decidir o que é mais relevante agora”.
Um feed baseado em grafo social é impulsionado por quem você segue; um feed baseado em grafo de interesses é impulsionado por o que você faz (assiste, pula, reassiste, compartilha, pesquisa). A abordagem por grafo de interesses pode funcionar mesmo quando você não segue ninguém, mas depende fortemente de obter recomendações boas o bastante cedo e aprender rápido a partir do feedback.
A maioria dos feeds faz duas coisas principais:
A geração de candidatos encontra “possíveis encaixes”; o rankeamento decide a ordem final, onde pequenas mudanças podem remodelar o que você assiste em seguida.
Sinais fortes geralmente vêm do comportamento observável, especialmente:
Curtidas e comentários importam, mas o comportamento de visualização costuma ser o mais confiável porque é mais difícil de falsificar em escala.
Para novos usuários, as plataformas começam com escolhas diversas e “seguras” — conteúdo popular no seu idioma/região — para detectar preferências rapidamente. Para novos vídeos, elas costumam fazer um teste de distribuição: mostrar o vídeo a pequenos grupos prováveis e expandir se o engajamento for forte. Na prática, isso permite que criadores desconhecidos estoure m mesmo sem muitos seguidores, se o desempenho inicial for bom.
Exploração evita que o feed fique repetitivo, testando intencionalmente conteúdo adjacente ou incerto. Táticas comuns incluem:
Sem exploração, o sistema pode se ajustar demais e criar ciclos estreitos que parecem enfadonhos ou polarizados.
Otimização descontrolada ocorre quando a forma mais fácil de ganhar atenção é com conteúdo sensacionalista ou extremo, e o algoritmo acaba recompensando isso. As plataformas tentam conter isso com regras de diversidade, limiares de qualidade e políticas de segurança, além de controles de ritmo para impedir que conteúdo de alta excitação domine toda sessão.
Logística de conteúdo é o pipeline ponta-a-ponta que leva um conteúdo do telefone do criador até a tela do espectador:
Se esse pipeline for lento ou inconsistente, as recomendações sofrem porque o sistema recebe menos inventário (e de pior qualidade) e os loops de feedback ficam mais fracos.
Ferramentas de criação de baixa fricção (templates, efeitos, bibliotecas de som, edição simples) aumentam a frequência de postagens e padronizam formatos, o que torna o conteúdo mais fácil de testar e comparar. Mecânicas de remix (duetos/stitches) funcionam como distribuição embutida, ancorando novos posts em clipes provados e ajudando o sistema a entender contexto e interesses mais rápido.
A cultura de experimentação transforma decisões de produto em hipóteses mensuráveis. Times liberam pequenas mudanças (ajustes de UI, pesos de rankeamento, notificações), medem resultados e promovem rapidamente as variantes vencedoras. Para manter responsabilidade, use métricas além do tempo total de visualização (por exemplo: satisfação, salvamentos/compartilhamentos, taxa de “não interessado”, taxa de reclamações) para que o crescimento não seja à custa do bem-estar do usuário.