Emad Mostaque và Stability AI đã góp phần khiến AI sinh tạo mã nguồn mở lan truyền—tại sao Stable Diffusion phổ biến nhanh, và những tranh luận nó gây ra.

Tên Emad Mostaque gắn chặt với chương bùng nổ nhất của AI sinh tạo có trọng số mở: việc phát hành công khai Stable Diffusion và làn sóng sáng tạo, công cụ và tranh luận theo sau. Ông không phải là người phát minh duy nhất của công nghệ—cộng đồng nghiên cứu đằng sau rộng hơn nhiều so với bất kỳ cá nhân nào—nhưng ông trở thành gương mặt đại diện cho một ý tưởng cụ thể: các mô hình sinh tạo mạnh nên được tiếp cận rộng rãi, không nên bị khóa sau giao diện của một công ty duy nhất.
“Lan truyền” ở đây không chỉ là một tiêu đề hay một khoảnh khắc trên mạng xã hội. Đó là một mô hình bạn có thể quan sát ngoài đời:
Khi một bản phát hành kích hoạt cả bốn yếu tố này, nó ngừng là “một mô hình” và bắt đầu hành xử như một phong trào.
Phát hành mở có thể thúc đẩy học hỏi và mở khóa công việc sáng tạo mới. Nhưng chúng cũng có thể làm gia tăng lạm dụng, làm trầm trọng xung đột bản quyền, và chuyển gánh nặng an toàn cùng hỗ trợ sang các cộng đồng vốn không hề yêu cầu những trách nhiệm đó. Sự ủng hộ công khai của Mostaque biến ông thành biểu tượng cho những căng thẳng đó—được khen ngợi bởi những người xây dựng muốn tiếp cận, bị chỉ trích bởi những người lo ngại về tổn hại và trách nhiệm.
Bài viết phân tích cách Stable Diffusion hoạt động (không đi sâu vào toán học), cách truy cập mở nuôi dưỡng hệ sinh thái người sáng tạo, lý do tranh cãi nổ ra, và “mở vs đóng” thực sự có ý nghĩa gì khi bạn chọn công cụ cho dự án thực tế. Cuối cùng, bạn sẽ có một cách thực dụng để hiểu làn sóng lan truyền—và quyết định chiến lược generative AI phù hợp với bạn.
Trước khi Stable Diffusion bùng nổ, AI sinh tạo đã khiến người ta hứng thú—nhưng cũng bị khoá cửa. Hầu hết trải nghiệm tạo ảnh qua danh sách chờ, beta giới hạn, hoặc demo được chăm chút. Nếu bạn không thuộc “nhóm trong” (một phòng thí nghiệm, startup có vốn, hay một nhà phát triển có quyền truy cập), bạn phần lớn chỉ đứng ngoài xem.
Mô hình qua API đóng giống như một cỗ máy mạnh đặt sau quầy: bạn gửi yêu cầu, nhận kết quả, và nhà cung cấp quyết định giá, quy tắc, giới hạn tốc độ và những gì được phép. Cách này có thể an toàn và đơn giản hơn, nhưng cũng có nghĩa việc thử nghiệm bị định hình bởi ranh giới của người khác.
Phát hành có trọng số mở đảo ngược trải nghiệm. Người sáng tạo có thể chạy mô hình trên phần cứng riêng, tinh chỉnh cài đặt, thử forks và lặp lại mà không cần xin phép cho từng prompt. Ngay cả khi một bản phát hành không hoàn toàn “mã nguồn mở” theo nghĩa nghiêm ngặt, việc có trọng số sẵn tạo cảm giác sở hữu và năng lực mà API hiếm khi cung cấp.
Đối với các cộng đồng sáng tạo, kinh tế không phải chú thích—đó là câu chuyện chính. Giá API và hạn mức có thể lặng lẽ ngăn cản việc thử nghiệm: bạn do dự khi muốn chạy 50 biến thể, khám phá phong cách ngách, hoặc xây một dự án phụ kỳ lạ nếu mỗi lần chạy đều như đồng hồ đang chạy.
Với mô hình tải về, thử nghiệm trở lại là một sở thích. Người ta trao đổi prompt, so sánh cài đặt, chia sẻ file checkpoint và học bằng cách làm. Vòng lặp thực hành đó biến “tạo ảnh bằng AI” từ một sản phẩm thành một thói quen.
Kết quả đầu ra vốn dễ chia sẻ: một hình ảnh có thể khơi gợi tò mò, tranh luận và bắt chước. Twitter, Reddit, server Discord và diễn đàn người sáng tạo trở thành kênh phân phối kỹ thuật và kết quả. Mô hình không lan truyền chỉ vì nó mạnh—mà vì các cộng đồng có thể remix nó, khoe nó và giúp nhau cải thiện nhanh chóng.
Stable Diffusion là bộ tạo ảnh theo văn bản: bạn gõ một prompt như “một cabin ấm áp trên núi tuyết lúc hoàng hôn,” và nó tạo ra một hình ảnh cố gắng phù hợp với từ ngữ của bạn.
Hãy nghĩ về nó như một hệ thống học các mẫu từ một lượng lớn ảnh kèm chú thích. Trong quá trình huấn luyện, mô hình chơi một trò đơn giản: lấy một ảnh rõ ràng, làm nó nhiễu bằng “tiếng ồn” thị giác, rồi học cách loại bỏ tiếng ồn đó từng bước cho đến khi bức tranh trở nên rõ ràng trở lại.
Khi bạn dùng nó, bạn bắt đầu từ nhiễu (về cơ bản là nhiễu tivi). Prompt của bạn hướng quá trình dọn dẹp để nhiễu dần dần biến thành thứ phù hợp mô tả. Nó không “sao chép” một ảnh cụ thể; nó sinh ra một cái mới bằng cách theo các mẫu thị giác đã học—màu sắc, bố cục, kết cấu, phong cách—và được điều khiển bởi văn bản của bạn.
Mọi người thường dùng các thuật ngữ lỏng lẻo, nên tách ra sẽ hữu ích:
Stable Diffusion lan truyền nhanh vì nó không yêu cầu lời mời đặc biệt hay tài khoản doanh nghiệp lớn. Nhiều người có thể:
Kết quả ban đầu không cần hoàn hảo để trở nên lan truyền. Khi việc sinh nhanh, bạn có thể lặp: sửa prompt, đổi phong cách, thử seed khác, và chia sẻ đầu ra tốt nhất trong vài phút. Tốc độ đó—kết hợp với chất lượng “đủ tốt” cho meme, concept art, thumbnail và prototype—khiến việc thử nghiệm dẻo dai và chia sẻ trở nên dễ dàng.
Emad Mostaque gắn liền với sự bùng nổ ban đầu của Stable Diffusion phần lớn vì ông là gương mặt đại diện rõ ràng nhất cho Stability AI—công ty đã góp vốn, đóng gói và phân phối công việc theo cách mà người sáng tạo có thể thử ngay.
Vai trò xuất hiện trước công chúng này quan trọng. Khi một mô hình mới, hầu hết mọi người không đọc bài báo hay theo dõi repo nghiên cứu. Họ theo các câu chuyện: một demo rõ ràng, một giải thích đơn giản, một liên kết hoạt động, và một lãnh đạo trả lời công khai. Mostaque thường làm phần “cửa trước”—phỏng vấn, bài đăng xã hội và tương tác cộng đồng—trong khi nhiều người khác làm phần “phòng máy”: nghiên cứu mô hình, xây dựng dataset, hạ tầng huấn luyện, đánh giá và công cụ mã nguồn mở giúp bản phát hành trở nên hữu dụng.
Đà ban đầu của Stability AI không chỉ là chất lượng mô hình. Nó còn là cảm giác tiếp cận nhanh chóng mà dự án tạo ra:
Cùng lúc đó, cần phân biệt “nổi bật nhất” với “người tạo duy nhất.” Thành công của Stable Diffusion phản ánh một hệ sinh thái rộng hơn: các phòng thí nghiệm học thuật (đặc biệt nhóm CompVis), nỗ lực dataset như LAION, nhà phát triển mã nguồn mở, và các đối tác xây ứng dụng, giao diện và tích hợp.
Mạch chuyện này—kể chuyện công khai rõ ràng kết hợp với phát hành mở và một cộng đồng sẵn sàng—là phần lớn lý do một mô hình biến thành phong trào.
Phát hành mở không chỉ “chia sẻ một công cụ.” Chúng thay đổi ai được tham gia—và ý tưởng lan truyền nhanh thế nào. Khi trọng số Stable Diffusion có thể tải xuống và chạy ngoài ứng dụng của một công ty, mô hình ngừng là một sản phẩm bạn ghé thăm và trở thành thứ người ta có thể sao chép, chỉnh sửa và truyền tay.
Với trọng số mở, người sáng tạo không bị giới hạn bởi giao diện cố định hay tập tính năng hẹp. Họ có thể:
Quyền “fork không cần xin phép” đó là nhiên liệu: mỗi cải tiến có thể được phân phối lại, không chỉ trình diễn.
Một vài vòng lặp lặp lại thúc đẩy động lực:
Khi nhà phát triển có thể tích hợp mô hình trực tiếp, nó xuất hiện khắp nơi: ứng dụng desktop, UI web, plugin Photoshop, bot Discord và công cụ tự động. Mỗi tích hợp là một điểm tiếp cận mới—và mỗi điểm tiếp cận mới đưa đến người dùng có thể không bao giờ cài một demo nghiên cứu.
Phát hành mở giảm chi phí “xin phép”. Giáo viên có thể thiết kế bài tập, người chơi có thể thử nghiệm ở nhà, và startup có thể prototype mà không cần thương thảo quyền truy cập. Cơ sở người tham gia rộng đó khiến một bản phát hành mô hình trở thành phong trào kéo dài, không chỉ một cơn sốt một tuần.
Khi weights của Stable Diffusion có sẵn, mô hình ngừng là “một thứ bạn đọc về” và trở thành thứ người ta dùng—theo nhiều cách khác nhau. Thay đổi rõ rệt nhất không chỉ là ảnh tốt hơn; đó là làn sóng công cụ khiến việc tạo ảnh bằng AI tiếp cận được nhiều kiểu người sáng tạo.
Bạn có thể thấy hệ sinh thái tách thành các nhóm thiết thực:
Hãy coi mô hình cơ sở như một họa sĩ đa năng tài năng. Fine-tuning giống như cho họ một đợt đào tạo chuyên sâu: bạn cho xem một bộ ví dụ được tuyển chọn trong một phong cách (ví dụ, “ảnh sản phẩm thương hiệu bạn” hoặc “phong cách truyện tranh cụ thể”) cho tới khi nó vẽ giống thế một cách đáng tin cậy. Một mô hình tùy chỉnh là kết quả: một phiên bản vẫn biết vẽ rộng, nhưng có cảm quan mạnh cho ngách của bạn.
Động lực xã hội thực sự là việc chia sẻ workflow: “Đây là quy trình của tôi để nhân vật nhất quán,” “Đây là cách để có ánh sáng điện ảnh,” “Đây là pipeline mockup sản phẩm lặp được.” Người ta không tụ họp chỉ quanh Stable Diffusion—họ tụ họp quanh cách dùng nó.
Đóng góp cộng đồng cũng lấp nhanh các khoảng trống thực tế: hướng dẫn từng bước, dataset được tuyển chọn, model card và tài liệu, và các bộ lọc an toàn sơ khởi và công cụ kiểm duyệt nội dung cố gắng giảm lạm dụng trong khi vẫn giữ được khả năng thử nghiệm.
Phát hành mở hạ thấp rào cản “xin phép” để tạo ảnh bằng AI. Nghệ sĩ, nhà thiết kế, giáo viên và các nhóm nhỏ không cần ngân sách doanh nghiệp hay đối tác đặc biệt để thử nghiệm. Sự tiếp cận đó quan trọng: nó cho phép người ta thử ý tưởng nhanh, học bằng hành động và xây quy trình cá nhân phù hợp phong cách.
Với nhiều người sáng tạo, công cụ kiểu Stable Diffusion trở thành đối tác phác thảo nhanh. Thay vì thay thế nghề, chúng mở rộng số hướng bạn có thể khám phá trước khi đầu tư thời gian vào tác phẩm cuối.
Những lợi ích phổ biến gồm:
Vì weights có thể truy cập, cộng đồng xây UI, trợ giúp prompt, phương pháp fine-tune và pipeline làm cho việc tạo ảnh bằng AI khả thi cho người không chuyên nghiên cứu. Kết quả là ít “một demo thần kỳ” hơn và nhiều công việc sáng tạo lặp lại được hơn.
Cộng đồng lành mạnh hình thành các quy tắc không chính thức: ghi công nghệ sĩ khi tham khảo tác phẩm họ, không ngụ ý một ảnh là thủ công nếu nó do AI, và xin phép khi cần cho dữ liệu huấn luyện hoặc tài sản thương hiệu. Những thói quen đơn giản—giữ ghi chú nguồn, theo dõi prompt và tài liệu hóa chỉnh sửa—làm cho hợp tác suôn sẻ hơn.
Sự mở cũng lộ ra các khuyết tật: ảnh thừa (ngón tay thừa, chữ bị méo), thiên lệch trong đầu ra, và không nhất quán giữa các lần sinh. Với công việc chuyên nghiệp, kết quả tốt nhất thường cần tuyển chọn, prompt lặp, inpainting và hoàn thiện bởi con người—không phải chỉ một cú nhấp.
Các bản phát hành mở như Stable Diffusion không chỉ lan nhanh—chúng buộc những câu hỏi khó phải được đưa ra ánh sáng. Khi ai cũng có thể chạy mô hình cục bộ, tự do tương tự cho phép thử nghiệm cũng có thể cho phép gây hại.
Mối lo cốt lõi là lạm dụng ở quy mô: tạo deepfake, quấy rối nhắm mục tiêu và hình ảnh khiêu dâm không có đồng thuận. Đây không phải tình huống xa vời—mô hình trọng số mở giảm ma sát cho kẻ xấu, nhất là khi kết hợp với UI dễ cài đặt và cộng đồng chia sẻ prompt.
Cùng lúc, nhiều mục đích hợp pháp trông rất giống trên bề mặt (ví dụ, parody, fan art, biếm họa chính trị). Sự mơ hồ đó khiến câu hỏi “nên cho phép gì?” trở nên rối rắm, và đẩy vấn đề niềm tin lên công khai: ai chịu trách nhiệm khi phần mềm phân phối rộng rãi tạo điều kiện cho tổn hại?
Tranh cãi về bản quyền trở thành điểm bùng phát thứ hai. Những người phê bình cho rằng huấn luyện trên bộ dữ liệu lớn từ internet có thể bao gồm các tác phẩm có bản quyền mà không xin phép, và đầu ra đôi khi có thể giống phong cách nghệ sĩ đang hoạt động đến mức tạo cảm giác bắt chước hoặc cạnh tranh không công bằng.
Người ủng hộ phản bác rằng huấn luyện có thể là mang tính chuyển hoá, mô hình không lưu trữ ảnh như một cơ sở dữ liệu, và phong cách không đồng nghĩa với sao chép. Thực tế là điều này vẫn đang tranh luận—về mặt pháp lý và văn hoá—và quy tắc khác nhau theo pháp quyền. Ngay cả những người hiểu kỹ thuật cũng thường bất đồng về ý nghĩa của “công bằng”.
AI sinh tạo mã nguồn mở làm rõ một căng thẳng lâu nay: tính mở cải thiện tiếp cận, minh bạch và đổi mới, nhưng giảm kiểm soát tập trung. Một khi trọng số công khai, việc loại bỏ một khả năng khó hơn nhiều so với cập nhật một API.
Những cách giảm thiểu phổ biến xuất hiện, mỗi cách có đánh đổi:
Không có biện pháp nào “giải quyết” hoàn toàn tranh cãi, nhưng chúng cùng vạch ra cách cộng đồng cố gắng cân bằng tự do sáng tạo với giảm thiểu hại—mà không giả vờ có một câu trả lời duy nhất toàn diện.
Phát hành mở có vẻ nhẹ nhàng với công chúng: một checkpoint xuất hiện, repo xuất hiện, và đột nhiên ai cũng có thể tạo ảnh. Nhưng đằng sau khoảnh khắc đó, “mở” tạo ra những nghĩa vụ không hiện ra trên một thread ra mắt.
Huấn luyện (hoặc thậm chí tinh chỉnh) một mô hình ảnh hàng đầu cần thời gian GPU khổng lồ, cộng với nhiều lần chạy đánh giá. Khi weights công khai, hóa đơn compute không kết thúc—các đội vẫn cần hạ tầng cho:
Gánh nặng hỗ trợ nặng vì người dùng không còn là một khách hàng ký hợp đồng; đó là hàng nghìn người sáng tạo, người chơi, nhà nghiên cứu và doanh nghiệp với nhu cầu và thời hạn mâu thuẫn. “Miễn phí dùng” thường chuyển thành “tốn kém để duy trì.”
Phát hành trọng số mở có thể giảm rào cản, nhưng nó cũng giảm kiểm soát. Các biện pháp an toàn gắn trong sản phẩm host (bộ lọc, giám sát, giới hạn tốc độ) có thể không đi theo mô hình khi nó được tải xuống. Bất kỳ ai cũng có thể gỡ bỏ rào chắn, fine-tune để vượt qua chúng, hoặc đóng gói mô hình vào công cụ nhằm mục tiêu quấy rối, deepfake hay nội dung không đồng thuận.
Công bằng có khoảng trống tương tự. Truy cập mở không giải quyết câu hỏi về quyền dữ liệu huấn luyện, ghi công hay bồi thường. Một mô hình có thể “mở” nhưng vẫn phản ánh các bộ dữ liệu tranh chấp, động lực quyền lực không đều, hoặc giấy phép không rõ ràng—khiến nghệ sĩ và người sáng tạo nhỏ cảm thấy bị phơi bày hơn là được trao quyền.
Một thách thức thực tế là quản trị: ai có quyền quyết định cập nhật, biện pháp bảo vệ và quy tắc phân phối sau khi phát hành?
Nếu phát hiện lỗ hổng mới, dự án nên:
Không có sự quản trị rõ ràng—bảo trì viên, nguồn tài trợ và quyết định minh bạch—cộng đồng phân mảnh thành nhiều fork, mỗi fork với tiêu chuẩn an toàn và chuẩn mực khác nhau.
Nhà nghiên cứu có thể ưu tiên khả năng tái lập và truy cập. Nghệ sĩ có thể ưu tiên tự do sáng tạo và đa dạng công cụ. Doanh nghiệp thường cần độ dự đoán: hỗ trợ, rõ ràng về trách nhiệm pháp lý và phát hành ổn định. Mô hình mở có thể phục vụ cả ba—nhưng không thể mặc định cùng một cấu hình cho tất cả. Chi phí ẩn của “mở” là thương lượng các đánh đổi đó, rồi trả tiền để duy trì chúng qua thời gian.
Chọn giữa AI sinh tạo mở và đóng không phải bài kiểm tra triết lý—đó là quyết định sản phẩm. Cách nhanh nhất để làm đúng là bắt đầu bằng ba câu hỏi rõ ràng: Bạn xây gì, ai sẽ dùng nó, và bạn chấp nhận bao nhiêu rủi ro?
Mô hình trọng số mở (ví dụ, các bản phát hành kiểu Stable Diffusion) phù hợp khi bạn cần kiểm soát: fine-tune tùy chỉnh, dùng offline, triển khai on-prem, hoặc tích hợp sâu vào workflow.
API có host phù hợp khi bạn muốn tốc độ và đơn giản: mở rộng có thể dự đoán, cập nhật được quản lý và ít rắc rối vận hành hơn.
Lai thường thắng trong thực tế: dùng API cho độ tin cậy cơ bản, và trọng số mở cho chế độ chuyên biệt (công cụ nội bộ, tùy chỉnh cao cấp, hoặc kiểm soát chi phí khi sử dụng nặng).
Nếu bạn xây sản phẩm quanh những lựa chọn này, tooling quan trọng không kém chọn mô hình. Ví dụ, Koder.ai là nền tảng vibe-coding cho phép đội tạo web, backend và app di động qua chat—hữu ích khi bạn muốn prototype một workflow generative-AI nhanh, rồi phát triển thành ứng dụng thực—đặc biệt khi app của bạn cần tính năng sản phẩm chuẩn như auth, hosting, domain tùy chỉnh và rollback.
Nếu bạn không trả lời được ít nhất bốn câu, bắt đầu với API có host, đo lường sử dụng thực, rồi chuyển sang weights mở khi quyền kiểm soát có lợi.
Khoảnh khắc Stable Diffusion không chỉ phổ biến hoá tạo ảnh bằng AI—nó thay đổi kỳ vọng. Sau khi trọng số mở xuất hiện, “thử tự mình” trở thành cách mặc định mọi người đánh giá AI sinh tạo. Người sáng tạo bắt đầu coi mô hình như công cụ sáng tạo (có thể tải xuống, remix, cải tiến), trong khi doanh nghiệp mong đợi vòng lặp nhanh hơn, chi phí thấp hơn và khả năng chạy mô hình nơi dữ liệu của họ nằm.
Sự thay đổi này có khả năng kéo dài. Phát hành mở chứng minh rằng phân phối có thể quan trọng như năng lực thô: khi một mô hình dễ tiếp cận, cộng đồng xây hướng dẫn, UI, fine-tune và thực hành tốt giúp nó dùng được cho công việc hàng ngày. Đổi lại, công chúng giờ mong các mô hình mới minh bạch hơn về bản chất, dữ liệu hình thành và mức độ an toàn.
Chương tiếp theo ít là “chúng ta có thể sinh ra không?” và nhiều hơn “theo quy tắc nào?”. Quy định vẫn đang phát triển theo vùng, và chuẩn mực xã hội cập nhật không đều—đặc biệt quanh đồng thuận, ghi công và ranh giới giữa cảm hứng và bắt chước.
Các biện pháp kỹ thuật cũng đang tiến triển. Watermarking, metadata nguồn gốc, tài liệu dataset tốt hơn và bộ lọc nội dung mạnh hơn có thể giúp, nhưng không hoàn chỉnh. Mô hình mở khuếch đại cả đổi mới lẫn rủi ro, nên câu hỏi liên tục là làm sao giảm hại mà không đóng băng thử nghiệm.
Nếu bạn dùng AI sinh tạo mở, hãy coi nó như công cụ chuyên nghiệp:
Emad Mostaque trở thành biểu tượng của làn sóng lan truyền này vì chiến lược rõ ràng: phát hành truy cập, để cộng đồng chạy với nó, và chấp nhận rằng tính mở thay đổi cân bằng quyền lực. Tương lai của generative AI sẽ được định hình bởi căng thẳng đó—giữa tự do xây dựng và trách nhiệm chung để làm cho những gì được xây dựng đáng tin cậy.
Ông ấy trở nên rất nổi bật với tư cách CEO của Stability AI và là người ủng hộ công khai cho việc tiếp cận rộng rãi các mô hình sinh tạo. Trong khi nhiều nhà nghiên cứu và đóng góp viên mã nguồn mở làm phần “phòng máy”—nghiên cứu mô hình, dựng dataset, huấn luyện và công cụ—thì ông thường làm phần “cửa chính”: giải thích sứ mệnh, tương tác cộng đồng và khuếch đại các bản phát hành mà mọi người có thể thử ngay.
Trong ngữ cảnh này, “lan truyền” nghĩa là một mô hình gây ra một mô hình hành vi có thể đo lường được:
Khi cả bốn yếu tố xuất hiện, một mô hình hành xử giống như một phong trào, chứ không chỉ là một bản demo.
API đóng là dịch vụ được host: bạn gửi prompt, nhận kết quả, và nhà cung cấp quyết định giá, giới hạn tốc độ, chính sách và cập nhật. Mô hình tải về/weights mở chạy trên phần cứng của bạn, nên bạn có quyền kiểm soát:
Nhưng bạn cũng phải chịu trách nhiệm nhiều hơn cho cài đặt và an toàn.
Stable Diffusion học cách biến nhiễu ngẫu nhiên thành ảnh từng bước, được hướng dẫn bởi prompt văn bản của bạn. Trong quá trình huấn luyện nó học các mẫu từ rất nhiều cặp ảnh–chú thích; khi tạo ảnh, nó bắt đầu từ “nhiễu” và dần dần loại bỏ nhiễu để tiến tới thứ khớp với mô tả.
Nó sinh ra một ảnh mới dựa trên các mẫu đã học, không phải truy xuất một hình ảnh đã lưu trong cơ sở dữ liệu.
Chúng liên quan nhưng không giống nhau:
Một dự án có thể mở mã nhưng hạn chế weights (hoặc ngược lại), và điều khoản thương mại có thể khác nhau giữa mã và trọng số.
Vì chất lượng “đủ tốt” cộng với lặp nhanh tạo thành vòng phản hồi chặt: nếu bạn có thể sinh, chỉnh và chia sẻ kết quả trong vài phút, cộng đồng nhanh chóng phát triển:
Tốc độ biến thử nghiệm thành thói quen, và thói quen lan truyền.
Đó là việc huấn luyện thêm để hướng mô hình cơ sở về một mục tiêu hẹp (một phong cách, độ nhất quán nhân vật, ảnh sản phẩm). Thực tế gồm:
Đây là cách cộng đồng nhanh chóng tạo các biến thể chuyên biệt khi weights có sẵn.
Rủi ro phổ biến gồm deepfake, quấy rối và hình ảnh khiêu dâm không có sự đồng thuận—dễ thực hiện hơn khi mô hình chạy cục bộ mà không có kiểm soát tập trung. Các biện pháp giảm thiểu thực tế (không hoàn hảo) gồm:
Phân phối mở giảm bớt cơ chế kiểm duyệt, nhưng cũng làm suy yếu các rào chắn thực thi.
Tranh luận tập trung vào dữ liệu huấn luyện (các tác phẩm có bản quyền có thể được dùng mà không xin phép) và các đầu ra có thể giống phong cách của nghệ sĩ đang còn sống. Một vài điểm chính:
Với dự án thực tế, hãy coi việc cấp phép và nguồn gốc là yêu cầu, không phải chuyện sau cùng.
“Miễn phí tải” vẫn tốn tiền và công sức để duy trì:
Nếu không có người giữ gìn rõ ràng và nguồn tài trợ, cộng đồng sẽ phân mảnh thành nhiều fork với tiêu chuẩn và bảo trì không đều.