Khóa luận Ứng dụng luật kết hợp trong khai phá dữ liệu quản lý nguồn nhân lực tại Huyện ủy A Lưới

<p> Bước cắt tỉa (prune step): đây là bước tiếp theo sau bước join. Trong bước này, ta cần loại bỏ tất cả các k-itemset cCk mà chúng tồn tại một (k-1)-mục không có mặt trong Lk-1. Giải thích điều này như sau: giả sử s là một (k-1)-mục của c mà không có mặt trong Lk-1. Khi đó, support (s) < minsup. Mặt khác, theo tính chất 2 p.34, vì c  s nên support(s ) < minsup. Vậy c không thể là một large-itemset, nó cần phải loại bỏ khỏi Ck. * Tóm lại, thuật toán Apriori có thể thực hiện theo các bước sau[2]: 1. Duyệt (Scan) toàn bộ dữ liệu giao dịch (transaction database) để có được độ hỗ trợ S của 1-itemset, so sánh S với minsup, để có được 1-itemset (L1) 2. Sử dụng Lk-1 nối (join) Lk-1 để sinh ra candidate k-itemset. Loại bỏ các itemsets không phải là các tập phổ biến (frequent itemsets) thu được k-itemset 3. Duyệt dữ liệu giao dịch (transaction database) để có được độ hỗ trợ của mỗi candidate k-itemset, so sánh S với minsup để thu được tập phổ biến k –itemset (Lk). 4. Lặp lại từ bước 2 cho đến khi tập ứng cử viên (C) trống (không tìm thấy frequent itemsets) 5. Với mỗi tập phổ biến I, sinh tất cả các tập con s không rỗng của I 6. Với mỗi tập con s không rỗng của I, sinh ra các luật s  (I-s) nếu độ tin cậy (Confidence) của nó lớn hơn hoặc bằng minconf. 2.2.5.5. Ví dụ về thuật toán Apriori Lấy dữ liệu từ bảng 2.3, ta có cơ sở dữ liệu giao dịch như sau: Bảng 2.4: Cơ sở dữ liệu bán hàng TID Các tập mục T1 Bánh mì, Bơ, Táo T2 Bánh mì, Phomat, Táo T3 Bơ, Phomat, Táo T4 Bánh mì, Phomat, Táo, Nho T5 Bánh mì, Bơ, Nho </p>

TÀI LIỆU LUẬN VĂN CÙNG DANH MỤC

TIN KHUYẾN MÃI

  • Thư viện tài liệu Phong Phú

    Hỗ trợ download nhiều Website

  • Nạp thẻ & Download nhanh

    Hỗ trợ nạp thẻ qua Momo & Zalo Pay

  • Nhận nhiều khuyến mãi

    Khi đăng ký & nạp thẻ ngay Hôm Nay

NẠP THẺ NGAY