Phần này xác định một cài đặt vấn đề Học Tăng Dần Theo Thực Thể (IIL) mới, thực tế tập trung vào việc nâng cấp mô hình hiệu quả về chi phí trong các hệ thống đã triển khai.Phần này xác định một cài đặt vấn đề Học Tăng Dần Theo Thực Thể (IIL) mới, thực tế tập trung vào việc nâng cấp mô hình hiệu quả về chi phí trong các hệ thống đã triển khai.

Cài đặt IIL mới: Nâng cao mô hình đã triển khai chỉ với dữ liệu mới

2025/11/05 23:00

Tóm tắt và 1 Giới thiệu

  1. Các công trình liên quan

  2. Thiết lập vấn đề

  3. Phương pháp luận

    4.1. Chưng cất nhận thức ranh giới quyết định

    4.2. Củng cố kiến thức

  4. Kết quả thực nghiệm và 5.1. Thiết lập thí nghiệm

    5.2. So sánh với các phương pháp SOTA

    5.3. Nghiên cứu loại bỏ

  5. Kết luận và công việc tương lai và Tài liệu tham khảo

    \

Tài liệu bổ sung

  1. Chi tiết phân tích lý thuyết về cơ chế KCEMA trong IIL
  2. Tổng quan thuật toán
  3. Chi tiết bộ dữ liệu
  4. Chi tiết triển khai
  5. Hình ảnh trực quan của các hình ảnh đầu vào bị phủ bụi
  6. Thêm kết quả thực nghiệm

3. Thiết lập vấn đề

Minh họa về thiết lập IIL được đề xuất được thể hiện trong Hình 1. Như có thể thấy, dữ liệu được tạo ra liên tục và không thể dự đoán trong luồng dữ liệu. Nhìn chung trong ứng dụng thực tế, mọi người có xu hướng thu thập đủ dữ liệu trước và huấn luyện một mô hình mạnh M0 để triển khai. Dù mô hình mạnh đến đâu, nó cũng sẽ không thể tránh khỏi việc gặp phải dữ liệu ngoài phân phối và thất bại trên đó. Những trường hợp thất bại này và các quan sát mới có điểm số thấp khác sẽ được chú thích để huấn luyện mô hình theo thời gian. Việc huấn luyện lại mô hình với tất cả dữ liệu tích lũy mỗi lần dẫn đến chi phí thời gian và tài nguyên ngày càng cao hơn. Do đó, IIL mới nhằm mục đích nâng cao mô hình hiện có chỉ với dữ liệu mới mỗi lần.

\

\ Hình 2. Ranh giới quyết định (DB): (a) DB học từ dữ liệu cũ và dữ liệu mới, tương ứng. Đối với DB cũ, dữ liệu mới có thể được phân loại thành các mẫu bên trong và mẫu bên ngoài. (b) DB lý tưởng bằng cách huấn luyện chung trên dữ liệu cũ và dữ liệu mới. (c) tinh chỉnh mô hình trên dữ liệu mới với nhãn one-hot gặp phải CF. (d) học với chưng cất trên các mẫu nguyên mẫu gây ra overfitting cho các mẫu này và sự sụp đổ DB. (e) DB đạt được bằng cách sử dụng chưng cất nhận thức ranh giới quyết định (DBD) của chúng tôi.

\

:::info Tác giả:

(1) Qiang Nie, Đại học Khoa học và Công nghệ Hồng Kông (Quảng Châu);

(2) Weifu Fu, Phòng thí nghiệm Tencent Youtu;

(3) Yuhuan Lin, Phòng thí nghiệm Tencent Youtu;

(4) Jialin Li, Phòng thí nghiệm Tencent Youtu;

(5) Yifeng Zhou, Phòng thí nghiệm Tencent Youtu;

(6) Yong Liu, Phòng thí nghiệm Tencent Youtu;

(7) Qiang Nie, Đại học Khoa học và Công nghệ Hồng Kông (Quảng Châu);

(8) Chengjie Wang, Phòng thí nghiệm Tencent Youtu.

:::


:::info Bài báo này có sẵn trên arxiv theo giấy phép CC BY-NC-ND 4.0 Deed (Attribution-Noncommercial-Noderivs 4.0 International).

:::

\

Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ service@support.mexc.com để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.