張一鳴とByteDanceが推薦アルゴリズムとコンテンツロジスティクスを組み合わせ、どのようにTikTok/Douyinをグローバルな注意(アテンション)エンジンへとスケールさせたかを解説します。

張一鳴(1983年生)はByteDanceの創業者として知られますが、彼の物語は単なる著名な起業家の話ではなく、特定のプロダクト信念の話です。
南開大学で学んだ後(マイクロエレクトロニクスからソフトウェアへ移行)、彼は検索、フィード、消費者向けインターネットのスケールに触れる仕事を経験しました:旅行検索のクシュン(去先)での開発、Microsoft Chinaでの短期勤務、そして初期の不動産サービス99fangの創業などです。
張の核心的な問いは単純でした:どうすれば多くの手間をユーザーにかけさせずに、正しい情報を正しい人に素早く当てることができるか?
初期のインターネット製品はユーザーが検索するか、ポータルやカテゴリをフォローすることを前提にしていました。しかしコンテンツが爆発的に増えるにつれ、ボトルネックは「情報が足りない」から「情報が多すぎる」へと変わりました。彼のプロダクト論は、ソフトウェアがフィルタリングをより大きく担い、継続的に行うことで、各インタラクションで体験が改善されるべきだ、というものでした。
最初からByteDanceはパーソナライゼーションを後付けの機能ではなく、第一のプロダクト原理として扱いました。そのマインドセットは次の三つの反復的な選択に現れます:
これは神話的な話ではなくメカニズムの分解です:レコメンデーションアルゴリズム、プロダクト設計、そして「コンテンツロジスティクス」がどのように協調して動くのか—そしてそれがクリエイター、広告主、安全性にとって何を意味するのかを解説します。
ByteDanceは短尺動画から始まったわけではありません。よりシンプルな問いから始まりました:コンテンツが過剰なときに、人々が有用で興味深い情報をどう見つけられるようにするか?
張一鳴の初期プロダクトは、各ユーザーが関心を持つものを学習してフィードの並び替えを行うニュース・情報アプリでした。
ブレイクアウトした初期プロダクトは今日のToutiao(ヘッドライン系アプリ)でした。ユーザーに出版社や友人をフォローさせる代わりに、コンテンツを在庫のように扱い、フィードをパーソナライズされた店頭として見なしました。
この見立ては重要で、企業にタグ付け、ランキング、満足度のリアルタイム計測といった中核の仕組みを早期に作らせました。
当時の多くの消費者向けアプリはソーシャルグラフに頼っていました—「誰を知っているか」があなたの目に入るものを決めます。ByteDanceはインタレストグラフに賭けました—「何を視聴し、スキップし、読むか、共有するか、検索するか」が次に何を見るかを決めます。
この選択は、ローンチ時のネットワーク効果への依存度を下げ、代わりに推薦をいかに早く「十分に良く」するかに依存させました。
当初からByteDanceはプロダクトの決定を仮説として扱いました。機能、レイアウト、ランキングの調整は継続的にテストされ、勝ったバリアントが速やかに出荷されました。
これは単なるA/Bテストの道具ではなく、学習速度を評価するマネジメントシステムでした。
記事に対する推薦エンジンが機能すると、よりリッチな形式へ移るのは自然な次の一歩です。動画はより明確なフィードバックシグナル(視聴時間、リプレイ、完了)、速い消費速度、そしてフィードが一貫して関連性を保てればより大きな上振れを提供します—これがDouyin、後のTikTokへの舞台を整えました。
メディアの大半の歴史では問題は希少性でした:すべてのニッチを満たすチャネルや出版社、クリエイターが十分にいるわけではなかった。配信は単純でした—テレビをつけ、新聞を読み、いくつかのウェブサイトを訪れる—そして“良い”コンテンツは限られたゲートを通ったものでした。
今ではボトルネックが逆転しています。どの人間も評価できないほど多くのコンテンツがあります。つまり「コンテンツが多すぎる」ことは単なる作成の問題ではなく配信の問題になっており、価値はより多くの投稿を作ることから、正しい視聴者に正しいものを素早く届けることへとシフトします。
時系列フィードは既に誰をフォローするかを知っていることを前提にします。友人や少数のクリエイターを追いかけるのには優れていますが、次の場合に苦戦します:
フォロワーに基づく発見はインカムベント(既存の有力者)を有利にします。早期にいくつかのアカウントが注意を独占すると、品質に関係なく他者の成長が難しくなります。
コンテンツが豊富なとき、プラットフォームは「見られた」だけでなく「楽しんだ」かを分けるシグナルを必要とします。視聴時間は重要ですが唯一の手がかりではありません。完了率、リプレイ、ポーズ、共有、「興味なし」のアクションは好奇心と満足を区別するのに役立ちます。
ブロードキャストモデルでは、スケールとは一つのヒットを何百万人にも届かせることを意味しました。パーソナライズモデルでは、スケールとは何百万の異なる“小さなヒット”を適切なマイクロオーディエンスに届けることを意味します。
課題はリーチではなく、速さと反復性を伴う関連性です。
Douyin/TikTokのフィードは魔法のように感じられますが、核心は単純です:システムは繰り返しあなたが楽しむであろうものを予測し、あなたの行動を観察して次の予測を更新します。
フィードを何百万点の商品を置く店だと考えてください。
候補生成は「ショートリスト」ステップです。巨大なカタログから、言語、地域、デバイス、フォローしているアカウント、関与したトピック、類似視聴者の嗜好といった広い手がかりを使って数百〜数千の動画を引き出します。
ランキングは「最終の並べ替え」ステップです。そのショートリストから、今あなたが最も視聴して楽しむ可能性が高い動画を予測し、順序付けます。ここでの小さな違いが次に何を見るかを変え、それがシステムの学習にも影響します。
アルゴリズムは心を読むわけではなく、行動を読みます。一般的なシグナルは:
加えて、何を一貫してスキップするか、ミュートするか、「興味なし」とマークするかといった“ネガティブ”な嗜好も学習します。
新規ユーザーには、安全で多様な地域・言語の人気コンテンツを出し、嗜好を素早く検出します。
新規動画には、しばしば制御された“トライアル”を行います:関心が高そうな小さなグループにまず見せ、エンゲージメントが強ければ配信を拡大します。これが、既存のオーディエンスがなくても未知のクリエイターがブレイクできる仕組みです。
短尺動画は数分で大量のフィードバックを生みます:多くの視聴、スワイプ、完了。シグナルが密に得られるため、モデルは急速に更新され、「テスト」と「学習」のループが締まります。
ByteDanceは異なるグループにわずかに異なるランキングルール(例えば、いいねより共有を重視するなど)を見せるA/Bテストを行えます。あるバージョンが満足度や時間の質など意味のある成果を改善すれば、それが新しいデフォルトになり、サイクルが続きます。
ByteDanceのフィードは「中毒性がある」と表現されることが多いですが、実際に起きているのは複利的なフィードバックシステムです。各スワイプは選択であると同時に計測でもあります。
視聴、スキップ、いいね、コメント、再生、共有のたびに、システムは次に何を見せるかを推定するためのシグナルを得ます。
単一の視聴だけでは情報量は少ないです。しかし何百万もの微小な行動、特に繰り返されるパターンが集合すると、何が注意を引き続けるかの明確な像ができます。プラットフォームはこれらのシグナルを使って:
これがフライホイールです:エンゲージメント → より良いマッチング → さらにエンゲージメント。マッチングが改善するとユーザーはより長く滞在し、余分な時間がより多くのデータを生み、そのデータが再びマッチングを改善します。
システムが「うまくいったものの続き」だけを追い求めると、フィードはすぐに反復的になります。だからほとんどの推薦システムは意図的に探索を含めます—新しい、隣接する、あるいは不確かなコンテンツを表示することです。
探索の例:
適切に行えば、フィードを新鮮に保ち、ユーザーが検索しないような発見を促します。
フライホイールは間違った方向にも回転します。注意を得る最も簡単な方法が扇情主義や過激なコンテンツなら、システムはそれを過度に報いるかもしれません。パーソナライズが狭くなりすぎるとフィルターバブルが生まれます。
プラットフォームは通常、満足度と新規性のバランスを取るために、多様性ルール、コンテンツ品質の閾値、安全ポリシー(後述)、および高刺激コンテンツが常に各セッションを支配しないようなペーシング制御を組み合わせます。
ByteDanceについて語るとき、多くの人は推薦アルゴリズムを指します。しかし同じくらい重要な静かなシステムがあります:コンテンツロジスティクス—クリエイターのスマホから適切な視聴者の画面へ動画を迅速かつ安全に何度も届けるためのエンドツーエンドのプロセスです。
それを注意のサプライチェーンと考えてください。倉庫やトラックの代わりにシステムは以下を管理します:
どのステップでも遅延や信頼性の低下があれば、アルゴリズムは扱うものが減り、クリエイターの動機付けも失われます。
高性能なフィードには常に新鮮な“在庫”が必要です。ByteDance型のプロダクトは、アプリ内テンプレート、エフェクト、音楽スニペット、編集ショートカット、ガイド付きプロンプトなどでクリエイターの制作コストを下げます。
これらは単なる楽しい機能ではありません。フォーマット(長さ、アスペクト比、テンポ)を標準化し、動画を完成させやすくすることで投稿頻度を上げ、パフォーマンスを比較しやすくします。
アップロード後、動画は複数の解像度と形式に処理され、異なるデバイスやネットワーク条件でスムーズに再生される必要があります。
高速処理が重要な理由:
信頼性もセッションを守ります。再生が途切れるとユーザーはスクロールを止め、フィードバックループが弱まります。
大規模に運用する場合、モデレーションは単一の判断ではなくワークフローです。多くのプラットフォームは階層的なステップを使います:自動検出(スパム、露出、暴力、著作権音源の検出)、リスクスコアリング、そしてエッジケースや異議申し立てのためのターゲットを絞った人間によるレビュー。
ルールは一貫して実行されてこそ効果を持ちます:明確なポリシー、レビュアーの訓練、監査証跡、エスカレーション経路、測定(誤検知、対応時間、再犯者)などです。
言い換えれば、施行はオペレーショナルなシステムであり、コンテンツの変化と同じ速さで進化しなければなりません。
ByteDanceの優位性は単に“アルゴリズム”にあるわけではありません。フィードのための適切なシグナルを生成し続けるようにプロダクトが作られている点にもあります。
優れた推薦システムには安定した供給が必要です。TikTok/Douyinは常時カメラ、簡単なトリミング、テンプレート、フィルター、大規模なサウンドライブラリで摩擦を減らします。
重要なデザインの細部:
より多くのクリエイターがより頻繁に投稿するほど、フィードは試す変種が増え、マッチングのチャンスが増えます。
全画面プレーヤーはUIの競合要素を取り払い、スワイプという一つの明確なアクションを促します。デフォルトでサウンドオンにすることで感情的インパクトが増し、トレンドが音声として広がりやすくなります。
この設計はデータ品質も向上させます。各スワイプが強い可否シグナルになるため、乱雑なインターフェイスより速く学べます。
リミックス形式は「作る」行為を「返信する」行為に変えます。これは重要です。返信は文脈を継承するからです:
実務では、リミックスはフォロワーを必要としない組み込みの配信手段になっています。
通知はループを再開できます(新しいコメント、クリエイターの投稿、ライブイベント)。ストリークなどの仕掛けは保持率を上げる一方で、強迫的なチェックを促すこともあります。
有用なプロダクト教訓:意味のある促し(あなたが求めた返信やフォロー)を優先し、圧力をかける促し(ストリーク喪失への恐れ)を避けること。
小さな選択――即時再生、最小限の読み込み、単一の主要ジェスチャー――が推奨フィードを探索のデフォルトにします。プロダクトは単にコンテンツを見せるのではなく、繰り返される行動を訓練します:アプリを開く → 見る → スワイプ → フィードを絞る。
ByteDanceは「アプリを翻訳して国際展開した」わけではありません。グローバル化をプロダクト問題でありオペレーティングシステムの問題として扱いました:人々が楽しむものは非常にローカルだが、それを届ける機構は一貫している必要がある、という考えです。
ローカリゼーションは言語から始まりますが、すぐに文脈へと移ります—ミーム、音楽、ユーモア、そして動画における「良し」とされるテンポなど。
ローカルなクリエイターコミュニティは重要です:初期成長は多くの場合、トーンを設定する少数のネイティブクリエイターに依存します。
チームは通常、以下をローカライズします:
利用が増えるにつれて、フィードは物流運用になります。地域チームはパートナーシップ(レーベル、スポーツリーグ、メディア)、クリエイタープログラム、地域法に即したポリシー執行を扱います。
モデレーションは階層でスケールします:プロアクティブなフィルタ、ユーザー通報、人間によるレビュー。目標は速度と一貫性です—明確な違反は素早く除去し、エッジケースは地域の専門知識で処理します。
グローバル展開はアプリストアのルールや端末の制約の中で生きることを意味します。アップデートは審査で遅れることがあり、機能は地域によって異なり、低スペック端末は動画品質、キャッシュ、データ使用量に関して厳しい選択を迫ります。
配信はマーケティングの余談ではなく、プロダクトが実際に何を確実にできるかを形作ります。
トレンドは数日で現れて消える一方、ポリシー策定やレビュアーの訓練は数週間を要します。チームは「一時的ルール」や急速な執行ガイダンス、そしてボラティリティの高い瞬間の緊密なモニタリングでその差を埋め、後に有効だったものを持続的なポリシーとツールに変換します。
より詳しくフィード背後の支援について知りたい方は /blog/content-logistics-hidden-system-behind-the-feed を参照してください。
ByteDanceのフィードは「アルゴリズム」と呼ばれますが、実際にはマーケットプレイスのように振る舞います。視聴者は注意という需要を持ち、クリエイターは動画という供給を行い、広告主はその注意に繰り返し安全に到達できることを対価として支払います。
クリエイターは単にコンテンツをアップロードするだけでなく、推薦システムがテストし、配信し、学習できる原材料を生産します。
一定の投稿フローがあると、プラットフォームはより多くの“実験”を実行できます:異なるトピック、フック、フォーマット、オーディエンス。
見返りとしてプラットフォームは行動を形成するインセンティブを提供します:
ブランドは通常、バイラルな運任せより繰り返し得られる成果を重視します:
推薦はニッチコミュニティを大きなフォロワー数なしに育てられます。同時に、多くの視聴者が類似の反応を示すと注目は急速にトレンドへ集中します。
このダイナミクスはクリエイターにとって戦略的な緊張を生みます:ニッチは忠誠を築くが、トレンド参加はリーチを急増させる。
配信がパフォーマンスベースであるため、クリエイターはシステムが素早く読み取れるシグナルに最適化します:強い導入、明確なフォーマット、シリーズ行動、継続的な投稿。
また読みやすいコンテンツ(明確なトピック、認識しやすい音源、繰り返せるテンプレート)を有利に扱います—スケールでマッチさせやすいためです。
ByteDanceの強みであるエンゲージメント最適化は内在的な緊張を生みます。同じシグナルが「人々がこれを見続ける」と言っても、それが「彼らにとって良い」かどうかは自動的には示しません。小規模ではこれはUXの問題ですが、TikTok/Douyin規模では信頼の問題になります。
推薦システムはユーザーがしたことから学び、後で後悔したかどうかは学びません。リプレイや長い視聴時間、深夜のスクロールは測りやすい。後悔や不安、強迫的使用は測りにくい。
フィードが測定可能なエンゲージメントだけを最適化すると、怒りや恐怖、執着を引き起こすコンテンツを過剰に報いることがあります。
市場ごとにいくつかの予測可能なリスクが現れます:
これらは社内に「悪意ある者」がいる必要はなく、通常の最適化からも生じ得ます。
人々はよく「なぜこれを見たのか?」という単純な説明を求めます。実際にはランキングは何千もの特徴量(視聴時間、スキップ、鮮度、デバイス文脈、クリエイター履歴)とリアルタイム実験の混合です。
プラットフォームが要因一覧を出しても、特定のインプレッションが生まれた一つの人間可読な理由にきれいに対応することは稀です。
安全性は事後のモデレーションだけではありません。製品と運用に組み込むことができます:
運用面では、訓練されたレビューチーム、エスカレーション経路、測定可能な安全KPI(成長KPIだけでなく)を意味します。
許容されるもの、異議申し立ての扱い、施行の監査がどのように行われるかに関するポリシーは信頼に直接影響します。ユーザーや規制当局がシステムを不透明または一貫性がないと見なせば、成長は脆弱になります。
持続可能な注意は単に人々を見続けさせることではなく、生活に出現し続ける許可を得ることを意味します。
ByteDanceの成功は「推薦+速い出荷」を単純レシピに見せます。再現可能なのは単一モデルではなく、発見を支えるオペレーティングシステムです:タイトなフィードバックループ、明確な計測、そしてそれらのループに供給するコンテンツパイプラインへの真剣な投資。
短い学習サイクルと測定可能な目標がある場合、早い反復は効果的です。すべての変更を仮説として扱い、小さく出し、日次で結果を読む—四半期ごとではなく。
指標は滞在時間だけでなく、ユーザー価値に焦点を当ててください。例:「フォローで終わるセッション」「保存/共有されたコンテンツ」「満足度調査」「クリエイターの定着率」。これらは生の視聴時間より難しいが、より良いトレードオフを導きます。
ガードレールなしのエンゲージメント最適化。もし「より多くの分数」がスコアボードなら、最終的に低品質で対立を煽る、繰り返しの多いコンテンツを報いるようになります。
またアルゴリズムが編集判断を不要にするという神話も避けるべきです。発見システムは常に選択をエンコードします:何をブーストするか、何を制限するか、エッジケースをどう扱うか。
スローガンではなく制約から始めてください:
推薦はコンテンツロジスティクスに依存します:ツール、ワークフロー、品質管理。早期に投資すべきは:
予算を立てるなら、モデル、モデレーション、サポートといったシステム全体のコストをスケール前に見積もってください(/pricing)。
エンジニアリングチーム向けの実用的な注記:多くの「システム」投資(ダッシュボード、内部ツール、ワークフローアプリ)は、ビルド–測定–学習ループを短くできれば素早くプロトタイプできます。Koder.aiのようなプラットフォームは、チャットインターフェースでウェブアプリをvibe-codeし、ソースコードをエクスポートまたはデプロイできるため、実験ダッシュボードやモデレーションキューのプロトタイプ、クリエイター運用ツールを素早く立ち上げるのに役立ちます。
詳しいプロダクト思考をもっと知りたい方は /blog をご覧ください。
ByteDanceの核となるプロダクト論は単純な方程式に要約できます:
レコメンデーションアルゴリズム + コンテンツロジスティクス + プロダクト設計 = スケーラブルな注意エンジン。
アルゴリズムは人々を関心のありそうな動画とマッチさせます。ロジスティクスは常に見るもの(供給、レビュー、ラベリング、配信、クリエイターツール)を確保します。プロダクト設計—全画面再生、迅速なフィードバックシグナル、低摩擦の作成—は各視聴を次の視聴を改善するデータに変えます。
いくつかの重要な詳細は内部アクセスなしには不明瞭または検証が難しい:
推測するよりは、企業や批評家、解説者の公表は仮説として扱い、公開情報、研究、観察されるプロダクト挙動全体から一貫した証拠を探してください。
過度に技術的にならずに深めたいなら、以下のトピックに注目してください:
これらの質問を常備しておけば、TikTok、Douyin、そして将来のフィードプロダクトをより明瞭に分析できます。
張一鳴のプロダクト論は、ソフトウェアがユーザーの行動シグナルを使って「継続的に」情報をフィルタリングし、各インタラクションで体験が改善されるべきだ、というものです。コンテンツ過多の世界では、プロダクトの役割は「情報を見つける手助け」から「今もっとも relevant なものを決める」へと移ります。
ソーシャルグラフ型のフィードは「誰をフォローしているか」によって決まるのに対し、インタレストグラフ型は「あなたが何をするか(視聴、スキップ、再生、共有、検索)」に基づきます。インタレストグラフ方式は、フォローしている人がいなくても機能しますが、初期段階で十分に良い推薦を行い、フィードバックから迅速に学習することに大きく依存します。
多くのフィードは主に二段階で動きます。
候補生成は「あり得る候補」を見つけ、ランキングが最終順位を決めます。
強いシグナルは主に行動から来ます。特に:
いいねやコメントも重要ですが、視聴行動は大規模に偽装しにくく、しばしば最も信頼できる指標です。
新規ユーザーに対しては、その言語/地域で人気のある多様で「安全な」コンテンツから始め、好みを素早く検出します。新しい動画については、まず関心がありそうな小さなグループに試験的に配信し、エンゲージメントが高ければ配信を拡大します。これにより、既存フォロワーが少ないクリエイターでも、早期のパフォーマンス次第でブレイクすることが可能になります。
探索(exploration)はフィードが単調になるのを防ぐために意図的に組み込まれます。具体例:
探索がないと、システムは過学習して狭いループに陥りやすくなります。
「暴走最適化」は、注意を獲得する最も簡単な方法が扇情的・過激なコンテンツになることで、アルゴリズムがそれを過度に報いる状態です。プラットフォームはこれを多様性ルール、品質の閾値、安全ポリシー、そして高刺激コンテンツが毎セッションを支配しないようなペーシング制御で管理しようとします。
コンテンツロジスティクスとは、クリエイターの端末から視聴者の画面にコンテンツを素早く、安全に、継続的に届けるためのエンドツーエンドのパイプラインです。
このパイプラインが遅いか不安定だと、アルゴリズムに供給されるインベントリが減り、クリエイターのモチベーションも落ちます。つまりアルゴリズムと同等に重要です。
低摩擦の制作ツール(テンプレート、エフェクト、サウンドライブラリ、簡易編集)により投稿頻度が上がり、フォーマットが標準化されることで比較しやすくなります。リミックス機能(デュエット/ステッチ)は、新しい投稿を既存の実績あるクリップに紐づけ、自然な配信効果を生みます。これらはリーチの方法として重要な役割を果たします。
ByteDanceはA/Bテスト文化をプロダクト決定の中心に据え、小さな変更を素早く出して測定し、勝ちパターンを広げることで学習速度を高めました。責任ある運用のためには、ただの視聴時間ではない指標(満足度、保存/共有、「興味なし」率、苦情率など)を組み合わせるべきです。これにより成長がユーザーの健全性を損なわずに進みます。