Page 187 - Công nghệ kỹ thuật và công nghệ thông tin trong tiến trình công nghiệp hóa - hiện đại hóa Đồng bằng sông Cửu Long
P. 187

mỗi rừng ngẫu nhiên, một giá trị vector ngẫu nhiên được xác định (Breiman,
          2001). Kết quả thu được bằng cách chọn kết quả từ đa số do đó, rừng ngẫu
          nhiên phù hợp và mạnh mẽ hơn so với cây quyết định đơn lẻ.

               Tăng cường độ dốc
               Tăng cường độ dốc là một kỹ thuật máy học mạnh mẽ khác cũng dựa
          trên cây quyết định. Thuật toán này thuộc về kỹ thuật tăng cường đào tạo một
          nhóm các mô hình riêng lẻ theo cách tuần tự, và mỗi mô hình riêng lẻ sẽ học
          hỏi từ những sai lầm của mô hình trước đó.
               9.4.3  Kết quả

            Để dự đoán sự xuất hiện của bệnh, tập dữ liệu đã được chia thành tập huấn
          luyện và tập kiểm tra (tỷ lệ 4:1) với số lượng 145 và 37 ao nuôi tương ứng.

            Thuật toán hồi quy logistic cho kết quả chính xác trên bệnh viêm gan tụy,
          đốm trắng và bệnh chậm lớn lần lượt là 91,89%; 72,97% và 72,97%. Kết quả
          được biểu diễn ở Bảng 9.2.
               Bảng 9.2. Kết quả dự đoán của hồi quy logistic

                               Tập huấn luyện                   Tập kiểm tra
                             Đúng          Tỷ lệ            Đúng          Tỷ lệ
           Đốm trắng          129          88,96              27          72,97
           Chậm lớn           126          86,89              27          72,97
           Viêm gan tụy       142          97,93              34          91,89

               Thuật toán mạng neuron cho kết quả dự đoán trên bệnh viêm gan tụy,
          đốm trắng và bệnh chậm lớn lần lượt là 91,89%; 83,78% và 75,67%. Kết quả
          được biểu diễn ở Bảng 9.3.

               Bảng 9.3. Kết quả dự đoán của mạng lưới neuron
                               Tập huấn luyện                   Tập kiểm tra
                             Đúng          Tỷ lệ            Đúng          Tỷ lệ
           Đốm trắng          141          97,24              31          83,78
           Chậm lớn           139          95,86              28          75,67
           Viêm gan tụy       140          96,55              34          91,89

               Thuật toán rừng ngẫu nhiên cho kết quả dự đoán tương đối ổn định trên
          bệnh viêm gan tụy, đốm trắng và bệnh chậm lớn lần lượt là 83,78%; 83,78%
          và 78,37%. Kết quả được biểu diễn ở Bảng 9.4.




                                                                                173
   182   183   184   185   186   187   188   189   190   191   192