Trích dẫn Gửi bởi imagination Xem bài viết
Giờ đây nếu ta cứ đi theo hướng search nước là phần mềm ngày càng tụt hậu. Neural Network có thể tận dụng cả triệu ván cờ quá khứ, có kết quả thắng thua để gắn nhãn mạnh yếu từng nước đi. Machine Learning do đó mang tính practical (thực tế) và có thể đánh chết bất kì một phần mềm cờ nào đi theo lối mòn. Vì nó có khả năng học bổ sung, và search nước truyền thống dù có mạnh cỡ nào nó cũng học được hết.

NN, hay ConvNN, còn mạnh tới nỗi có thể phân loại 1000 nhãn hình khác nhau (chó, mèo, bàn, ghế, quần, áo...) với độ chính xác 90%. NN học từ vài triệu tấm ảnh đã gắn nhãn. Vì cơ sở dữ liệu quá lớn nên có thể mất 1 tuần trên dàn máy với GPU 1080 Ti. Tương tự, trong cờ, việc đưa toàn bộ dữ liệu ở quá khứ vào cho NN phân tích mạnh yếu vẫn còn quá ít so với việc train dữ liệu hình ảnh.

Recurrent NN với LSTM cell, có thể phân tích dữ liệu thời gian (time-series), như việc dự đoán tỉ giá thị trường, dự đoán thời tiết, phát hiện nhịp tim bất thường... Áp dụng RNN vào cờ là công việc hiện nay của các data scientist ở Google AI. Chẳng hạn, pháo 2 bình 5 mã 8 tấn 7 mã 2 tấn 3, thì sau đó cờ đen nên đi nước nào thì kết quả là tốt nhất? RNN chỉ cần học từ vô vàn ván cờ quá khứ trong tích tắc và cho ra kết quả tối ưu. Trong một phạm trù nào đó, ta có thể hiểu NN không cần phải biết luật cờ là gì (tuy nhiên, việc gán vài luật cờ cơ bản cho nó để tránh error cũng là cần thiết).

Nếu được một lời khuyên, tôi xin chân thành khuyên tác giả đừng đi vào lối mòn search nước nữa. Đó đã quá lạc hậu. Việc học các ván cờ từ quá khứ bằng NN là việc không khó, cấu trúc NN, hay đúng hơn là RNN, đã có sẵn trên nhiều data science community, như Kaggle. Cái quan trọng là làm sao thu thập càng nhiều ván cờ càng tốt và phải preprocess data chỉn chu để feed vào NN.

Có thể việc search nước ngược từ lúc chiếu hết, chỉ hiệu quả ở giai đoạn cờ tàn. Còn từ khai cuộc đến hết trung cuộc, NN mạnh hơn cách truyền thống ở rất nhiều mặt. Nó có thể kết hợp với search truyền thống, bởi vì nó sẽ suggest nước đi trong tích tắc (vì model đã được train), chứ không cần tốn thời gian cho từng nước đi như cách truyền thống.

Ý trên khác hẳn với việc dò nước trong library. Việc dò nước trong library không đảm bảo đó là nước yếu hay mạnh.

Việc này chỉ cần, theo tôi nghĩ, vài tháng là tác giả có khả năng thành công. Bản thân tôi đang nghiên cứu tại UNSW cũng đang tham gia các machine learning competition trên Kaggle và thực hành với NN hằng ngày, nên tôi có cảm giác rằng nó nên được đưa vào cờ tướng.

Thân.
Tôi thường không thích nói trước về các dự án mới hoặc đang định hình. Nhưng vì một vài bạn muốn đề cập, nên tôi nói ngắn gọn thế này: tôi đã bắt đầu dự án này rồi, còn trước cả chương trình Felicity.

Nó phức tạp hơn em nghĩ nhiều và không phải muốn là chuyển sang làm được ngay. Nguyên nhân tập học / thời gian dậy quá lớn (cùng với một số lý do đặc thù khác của cờ Tướng). Em làm nghiên cứu không bị rào cản này vì có thể dễ dàng giảm quy mô dữ liệu (tập học) sao cho vừa với máy móc mình có.

Tôi sẽ bàn kỹ hơn nếu gặp nhau hoặc khi dự án phát triển đến mức thích hợp.