“Hiểu rõ Sự Lan truyền Ổn định/Tự động 1111: Hướng dẫn toàn diện về thuật ngữ Nghệ thuật Trí tuệ nhân tạo”

HTML Headings:

Điều gì làm bạn thấy khó khăn khi sử dụng Automatic 1111?

Stable Diffusion

Dataset và Model

Fine-tuned Model

Lora

Merged Models

Pruned versus Unpruned Models

Embeddings

CFG và VAEs

Hôm nay chúng ta sẽ cùng tìm hiểu về Automatic 1111 và những điều bạn thường thấy trên trang chủ. Tuy nhiên, nếu như bạn giống tôi, bạn sẽ mất khá nhiều thời gian để hiểu các tính năng này và biết cách sử dụng chúng để tận dụng tối đa. Chính vì vậy, hôm nay chúng ta sẽ cùng nhau tìm hiểu kỹ các tính năng này.

Stable Diffusion

Automatic 1111 dựa trên Stable Diffusion. Stable Diffusion là quá trình chuyển đổi văn bản đầu vào của bạn thành thông tin mà máy tạo hình có thể hiểu. Khi bạn nhập văn bản và nhấn nút tạo hình, Stable Diffusion sẽ tạo ra một hình ảnh ban đầu chứa nhiễu. Sau đó, Stable Diffusion sẽ tiếp tục làm việc với Clip, một công cụ dịch vụ cho văn bản của bạn để ta có được một hình ảnh đẹp hơn trong quá trình làm việc.

Dataset và Model

Khi nói đến Automatic 1111 thì Dataset và Model chắc hẳn không còn xa lạ với bạn nữa. Dataset là một bộ sưu tập ảnh được sử dụng để tạo ra Model. Một Model ko phải là gì khác ngoài một mẫu cơ bản nhằm tạo ra hình ảnh ban đầu.

Fine-tuned Model

Fine-tuned Model hoạt động như thế nào? Bắt đầu từ Model cơ bản, với Fine-tuned, bạn cần tập trung vào các thông số để tăng khả năng tìm kiếm của ảnh của mình. Ví dụ, nếu bạn muốn tạo ra bức hình của những chú chó màu đen đang đội chiếc mũ lễ, bạn cần cung cấp cho máy nhiều hình ảnh chó màu đen và đánh giá các hình ảnh đó mức độ ảnh hưởng quan trọng trong lúc tạo.

Lora

Lora là một phần bổ sung cho model. Nó giúp bạn điều khiển hình ảnh theo những cách bạn muốn. Lora có thể kiểm soát điểm style, loại hình ảnh, hoặc chủ đề, giúp bạn tạo ra ảnh với các hiệu ứng cụ thể.

Merged Models

Khi ghép nhiều models lại với nhau, ta sẽ thiết lập trọng số cho mỗi model. Khi ta kết hợp các model voi nhau, ta có thể tạo ra các hình ảnh thuộc cả hai model đó.

Pruned versus Unpruned Models

Pruned Models có dung lượng nhỏ hơn, dễ sử dụng và tạo ảnh nhanh hơn so với Unpruned Models. Tuy nhiên, các model Pruned sẽ có sức mạnh thấp hơn. Nếu bạn muốn tạo ra các model được sử dụng cho việc huấn luyện chính xác, dùng Unpruned models sẽ là phương án tốt hơn.

Embeddings

Embeddings giúp bạn mở rộng các model và tạo các từ khóa mới. Nó giúp bạn thêm ảnh vào model chính mà không giới hạn chỉ dừng ở những thứ được đưa vào. Ta có thể thêm những ảnh mới mà ta chưa có, hoặc thêm những từ khóa mới nhằm thay đổi chủ đề ảnh.

CFG và VAEs

CFG là một yếu tố quan trọng để tạo ra hiệu quả hình ảnh tốt nhất. VAEs khác nhau so với Lora rằng nó là một công cụ điều khiển khác. Thông qua khả năng nén ảnh của nó, máy VAE có thể giảm kích thước tệp và loại bỏ tiếng ồn của ảnh.