Felicity - sự trở lại của Saola, hay Ký sự phiêu lưu tại Giải cờ máy Thế giới Đài Loan

**nghiepdu** · 17-07-2018, 01:19 AM

Gửi bởi imagination

Giờ đây nếu ta cứ đi theo hướng search nước là phần mềm ngày càng tụt hậu. Neural Network có thể tận dụng cả triệu ván cờ quá khứ, có kết quả thắng thua để gắn nhãn mạnh yếu từng nước đi. Machine Learning do đó mang tính practical (thực tế) và có thể đánh chết bất kì một phần mềm cờ nào đi theo lối mòn. Vì nó có khả năng học bổ sung, và search nước truyền thống dù có mạnh cỡ nào nó cũng học được hết.

Nếu nói như bạn thì NN chỉ là học trò học máy móc các SW search nước truyền thống (tôi nghĩ NN của Google ko chỉ đơn giản như bạn cách bạn hiểu - vì như vậy thì rất nhiều người đã làm được rồi). Việc gán nhãn mạnh yếu vẫn phải phụ thuộc vào các SW "lạc hậu" này. Và chẳng ai đảm bảo được cách gán nhãn đó đúng tuyệt đối (với các thế phức tạp) cho nên data NN học được chưa phải chuẩn hoàn toàn. Do đó muốn NN chuẩn thì việc cải tiến các thuật toán đánh giá tìm kiếm vẫn luôn là cần thiết.

**Tiendaotd** · 17-07-2018, 05:46 AM

bác chezz tham dự hội nghị khoa học nào thế ạ?

**nguyenduy123** · 17-07-2018, 09:20 AM

Hy vòng là có pm cờ viết ra để phục vụ người học hỏi, luyện tập chứ pm giờ mạnh quá không thể học hỏi được gì
ý kiến về 1 pm cờ mới

https://drive.google.com/open?id=1nH..._NVDm0nA5pARgG

**tonetone** · 17-07-2018, 10:06 AM

Gửi bởi nguyenduy123

Hy vòng là có pm cờ viết ra để phục vụ người học hỏi, luyện tập chứ pm giờ mạnh quá không thể học hỏi được gì
ý kiến về 1 pm cờ mới

https://drive.google.com/open?id=1nH..._NVDm0nA5pARgG

Câu hỏi của bạn thực sự mình đọc rất kỹ mà không hiểu bạn đang viết về vấn đề gì luôn. Và đây là 1 topic của tác giả đang kể về cuộc hành trình thi đấu cờ máy ở giải quốc tế cũng như là sự trở lại của 1 phần mềm huyền thoại hy vọng bạn đừng spam các dạng hỏi như thế này làm loãng chủ đề chính của người ta.

Thân chào!

**chezz** · 18-07-2018, 10:04 AM

Gửi bởi imagination

Giờ đây nếu ta cứ đi theo hướng search nước là phần mềm ngày càng tụt hậu. Neural Network có thể tận dụng cả triệu ván cờ quá khứ, có kết quả thắng thua để gắn nhãn mạnh yếu từng nước đi. Machine Learning do đó mang tính practical (thực tế) và có thể đánh chết bất kì một phần mềm cờ nào đi theo lối mòn. Vì nó có khả năng học bổ sung, và search nước truyền thống dù có mạnh cỡ nào nó cũng học được hết.

NN, hay ConvNN, còn mạnh tới nỗi có thể phân loại 1000 nhãn hình khác nhau (chó, mèo, bàn, ghế, quần, áo...) với độ chính xác 90%. NN học từ vài triệu tấm ảnh đã gắn nhãn. Vì cơ sở dữ liệu quá lớn nên có thể mất 1 tuần trên dàn máy với GPU 1080 Ti. Tương tự, trong cờ, việc đưa toàn bộ dữ liệu ở quá khứ vào cho NN phân tích mạnh yếu vẫn còn quá ít so với việc train dữ liệu hình ảnh.

Recurrent NN với LSTM cell, có thể phân tích dữ liệu thời gian (time-series), như việc dự đoán tỉ giá thị trường, dự đoán thời tiết, phát hiện nhịp tim bất thường... Áp dụng RNN vào cờ là công việc hiện nay của các data scientist ở Google AI. Chẳng hạn, pháo 2 bình 5 mã 8 tấn 7 mã 2 tấn 3, thì sau đó cờ đen nên đi nước nào thì kết quả là tốt nhất? RNN chỉ cần học từ vô vàn ván cờ quá khứ trong tích tắc và cho ra kết quả tối ưu. Trong một phạm trù nào đó, ta có thể hiểu NN không cần phải biết luật cờ là gì (tuy nhiên, việc gán vài luật cờ cơ bản cho nó để tránh error cũng là cần thiết).

Nếu được một lời khuyên, tôi xin chân thành khuyên tác giả đừng đi vào lối mòn search nước nữa. Đó đã quá lạc hậu. Việc học các ván cờ từ quá khứ bằng NN là việc không khó, cấu trúc NN, hay đúng hơn là RNN, đã có sẵn trên nhiều data science community, như Kaggle. Cái quan trọng là làm sao thu thập càng nhiều ván cờ càng tốt và phải preprocess data chỉn chu để feed vào NN.

Có thể việc search nước ngược từ lúc chiếu hết, chỉ hiệu quả ở giai đoạn cờ tàn. Còn từ khai cuộc đến hết trung cuộc, NN mạnh hơn cách truyền thống ở rất nhiều mặt. Nó có thể kết hợp với search truyền thống, bởi vì nó sẽ suggest nước đi trong tích tắc (vì model đã được train), chứ không cần tốn thời gian cho từng nước đi như cách truyền thống.

Ý trên khác hẳn với việc dò nước trong library. Việc dò nước trong library không đảm bảo đó là nước yếu hay mạnh.

Việc này chỉ cần, theo tôi nghĩ, vài tháng là tác giả có khả năng thành công. Bản thân tôi đang nghiên cứu tại UNSW cũng đang tham gia các machine learning competition trên Kaggle và thực hành với NN hằng ngày, nên tôi có cảm giác rằng nó nên được đưa vào cờ tướng.

Thân.

Tôi thường không thích nói trước về các dự án mới hoặc đang định hình. Nhưng vì một vài bạn muốn đề cập, nên tôi nói ngắn gọn thế này: tôi đã bắt đầu dự án này rồi, còn trước cả chương trình Felicity.

Nó phức tạp hơn em nghĩ nhiều và không phải muốn là chuyển sang làm được ngay. Nguyên nhân tập học / thời gian dậy quá lớn (cùng với một số lý do đặc thù khác của cờ Tướng). Em làm nghiên cứu không bị rào cản này vì có thể dễ dàng giảm quy mô dữ liệu (tập học) sao cho vừa với máy móc mình có.

Tôi sẽ bàn kỹ hơn nếu gặp nhau hoặc khi dự án phát triển đến mức thích hợp.

**chezz** · 18-07-2018, 10:12 AM

Gửi bởi Tiendaotd

bác chezz tham dự hội nghị khoa học nào thế ạ?

The 10th International Conference on Computers and Games (CG2018)

**chezz** · 18-07-2018, 10:18 AM

Gửi bởi nguyenduy123

Hy vòng là có pm cờ viết ra để phục vụ người học hỏi, luyện tập chứ pm giờ mạnh quá không thể học hỏi được gì
ý kiến về 1 pm cờ mới

https://drive.google.com/open?id=1nH..._NVDm0nA5pARgG

Ngày xưa tôi có tạo một loạt chương trình cùng một loạt tiện ích để phục vụ người học. Ví dụ chương trình CCW chơi cờ yếu, có cả quyển sách loại tương tác được kèm theo. Saola, XB đi cùng rất nhiều các ván cờ (CSDL cờ), Saola cho xem các nhánh khai cuộc,... Nhưng hình như chẳng có mấy ai biết và khai thác được chúng. Do đó tôi tạm kết luận là những ai muốn học thì chỉ cần một quyển sách cờ là đủ. Còn lại thừa hết

**huybaichay** · 18-07-2018, 01:41 PM

Chào bác Nguyên

Em Huy tác giả của chương trình cờ vua Dolphin hiện đang xếp thứ 271 thế giới https://www.computerchess.org.uk/ccr....0#Dolphin_1_0

Em cũng đam mê viết chương trình cờ, ngày xưa cũng định viết cái cờ tướng như bác, nguyên lý giống nhau, chỉ khác cái hàm lượng giá đánh giá thế cờ và quy tắc đi quân thôi, còn thuật toán thì cờ vua và cờ tướng giống nhau hết.

Theo em nếu bác muốn phát triển thì dùng Trí tuệ nhân tạo mạng nơ ron thần kinh, cho nó học theo nguyên lý của Alpha Go, cho nó quét hết tất cả các ván cờ từ xưa đến nay của Trung Quốc vào rồi train. Việc này hơi tốn thời gian chút, đi theo hướng của bạn Imagine nói ở trên.

Nếu đi theo hướng Search thì lấy luôn cái source code của Fruit hoặc của chương trình cờ vua nổi tiếng thế giới nào đó (open source), rồi sửa lại quy tắc đi quân, kết hợp cùng 1 kiện tướng quốc gia về cờ tướng, viết lại hàm lượng giá. Là cờ mạnh ngay ạ

Em không có thời gian viết tiếp nữa vì còn phải kiếm xiền

**nghiepdu** · 18-07-2018, 06:57 PM

Gửi bởi huybaichay

Chào bác Nguyên

Em Huy tác giả của chương trình cờ vua Dolphin hiện đang xếp thứ 271 thế giới https://www.computerchess.org.uk/ccr....0#Dolphin_1_0

Em cũng đam mê viết chương trình cờ, ngày xưa cũng định viết cái cờ tướng như bác, nguyên lý giống nhau, chỉ khác cái hàm lượng giá đánh giá thế cờ và quy tắc đi quân thôi, còn thuật toán thì cờ vua và cờ tướng giống nhau hết.

Theo em nếu bác muốn phát triển thì dùng Trí tuệ nhân tạo mạng nơ ron thần kinh, cho nó học theo nguyên lý của Alpha Go, cho nó quét hết tất cả các ván cờ từ xưa đến nay của Trung Quốc vào rồi train. Việc này hơi tốn thời gian chút, đi theo hướng của bạn Imagine nói ở trên.

Nếu đi theo hướng Search thì lấy luôn cái source code của Fruit hoặc của chương trình cờ vua nổi tiếng thế giới nào đó (open source), rồi sửa lại quy tắc đi quân, kết hợp cùng 1 kiện tướng quốc gia về cờ tướng, viết lại hàm lượng giá. Là cờ mạnh ngay ạ

Em không có thời gian viết tiếp nữa vì còn phải kiếm xiền

Felicity cũng đã rất mạnh rồi, nó xếp thứ 4 trong giải cờ máy và quan trọng hơn là đứng đồng hạng với Xiexie cùng đối đầu trực tiếp hòa.

**chezz** · 19-07-2018, 07:45 AM

Tôi không đặt mục tiêu gì cho Felicity trong lần đầu đến giải cờ và sẽ chấp nhận mọi kết quả. Cũng không thể kỳ vọng gì hơn vì thời gian đầu tư cho chương trình như vậy là quá ngắn trong khi nhiều đấu thủ đã từng “săn” được Saola (Saola là tên của một loài dê mới được phát hiện gần đây ở Việt Nam). Hơn nữa tôi cũng không có bất cứ đầu tư nào cho phần cứng. Thay vào đó tôi dự định tập trung tìm hiểu mọi mặt của giải cờ, từ kỹ thuật cho đến con người, làm quen, trao đổi kinh nghiệm, nhìn tận mắt bắt tận tay những người đứng đằng sau các chương trình khô khan.

Chơi cờ tại giải là một trải nghiệm thú vị nhưng cũng khá căng thẳng. HaQiKi là đối thủ đầu tiên của Felicity. Nó là trình cờ của ông Muller tôi nói ở trên và từng có lúc “cân” được XieXie. Muller cùng từng tuyên bố nó đã thắng được Saola. Muller là người Âu duy nhất tham gia thi đấu cờ Tướng. Ông có thâm niên đam mê và viết các chương trình cờ lâu nhất: từ những năm 1970. Trong các chương trình cờ còn lại thì chỉ có Felicity gốc Việt. Các chương trình khác đều của các lập trình viên gốc Trung Quốc (Pascal Tang tác giả XieXie là Hoa kiều Vn sang sống ở Pháp).

Quay trở lại trận đấu. Hai chương trình phải đấu với nhau hai ván (mỗi bên đi trước một lần). HaQiKi có cẩm nang khai cuộc nên khởi đầu thuận lợi hơn. Felicity chuyên bỏ quân lấy thế nên thường xuyên kém quân. HaQiKi tận dụng được tối đa phần cứng và có tốc độ tính toán nút / giây gấp bốn lần Felicity dù chạy trên cùng loại máy tính. Lần đầu tiên đối đầu trực tiếp một đấu thủ tính nhanh như gió thế cũng thấy hoảng. Ván cờ căng thẳng. Tôi biết Felicity có tri thức cờ tốt hơn nhưng chẳng có gì đảm bảo trong cờ. Lỗi (bug) vẫn còn đầy ẩn nấp đâu đó và có thể bung ra, tự “vật” ngã nó bất cứ lúc nào. Hai ván thua trắng! Nhưng mà HaQiKi thua

Tôi thở phào!

Với một chương trình chưa đầy tuần tuổi thế là đã có màn khởi đầu và ra mắt trôi chảy. Thành thật mà nói tôi cũng dự đoán trước kết quả này. Tôi và Muller vẫn thường xuyên trao đổi trên một số diễn đàn cờ. Muller rất giỏi về kỹ thuật và lập trình, đặc biệt về những gì liên quan đến cờ. Tuy vậy ông không đủ cả về kiến thức lẫn độ tinh tế về cờ Tướng để giúp đứa con đẻ đi xa.

Felicity toàn thắng hai chương trình nữa (đều đến từ Đài Loan) cũng làm tôi trút được gánh nặng. Nó dường như không gặp khó khăn gì nhiều để ép và chiến thắng các chương trình không mấy tên tuổi đó. Điều khó khăn nhất lại là phải thắng được bản thân, không bị bùng phát những lỗi ngớ ngẩn khiến thua cả ván cờ.

Đối thủ khó nhằn đầu tiên chính là XieXie. XieXie thường xuyên dự giải cờ này và thành tích cao nhất hai lần huy chương bạc - tác giả đã rất tự hào công bố trên trang nhà. Đáng tiếc lần này tác giả không đến dự trực tiếp nhưng vẫn tham gia, nhờ người điều khiển giúp. XieXie chạy trên một máy tính mạnh i7 ép xung lên đến 4.7 GHZ đặt tại nhà riêng ở Pháp (người điều khiển truy nhập từ xa). Felicity không có máy tính riêng mà dùng một máy tính dành cho sinh viên của Khoa máy tính nơi diễn ra giải cờ. Máy yếu tốc độ chỉ 3.4 GHZ với bộ nhớ hạn hẹp 8 GB RAM. Tuy vậy Felicity có thể tận dụng và chạy trên toàn bộ 4 lõi (core) của bộ vi xử lý trong khi XieXie vẫn trung thành với công nghệ cũ chạy trên một lõi. Có thể tạm coi cả hai chương trình không ai có ưu thế đáng kể về phần cứng. XieXie luôn ưu thế về thời gian và khai cuộc tốt hơn Felicity (Felicity không có cẩm nang khai cuộc) và đôi khi ép khá mạnh Felicity. Dù ăn mồi bẫy XieXie lại hóa giải được các ưu thế của Felicity và dành chút lợi thế hơn quân về sau. Cuối cùng cả hai ván cờ đều hoà.

Trao đổi với tôi Pascal nói đã ngồi nhà quan sát trực tiếp trận chiến, hồi hộp và vô cùng hoảng sợ trong ván đầu khi XieXie ăn mồi, cảm thấy rất may mắn khi thủ hoà. Trước trận đấu, Pascal còn khăng khăng rằng XieXie sẽ tiếp tục dùng công nghệ trước đây. Nhưng sau trận đấu Pascal bảo rằng đang cân nhắc lại, có thể sẽ theo chân Felicity lột xác công nghệ, để có thể tồn tại lâu dài về sau.

Món nợ xưa chẳng ai trả được. Hai ván cờ không nói gì được nhiều nhưng cùng với kết quả chung kết có thể thấy Felicity đang tạm xoá nhoà khoảng cách nhiều năm phát triển bứt phá của XieXie.

Giờ đến lúc phải đấu với ba ông kễnh của giải cờ!

Muller đang rầu rĩ xem lại ván cờ sau khi thua Felicity

Màn hình bên trái là HaQiKi chạy với Winboard, bên phải là Felicity chạy với MoonRiver

XieXie đang được người điều khiển truy nhập và điều khiển từ xa

(Còn tiếp)

Chủ đề: Felicity - sự trở lại của Saola, hay Ký sự phiêu lưu tại Giải cờ máy Thế giới Đài Loan

Công cụ Chủ đề

Hiển thị

Phần 3

Đánh dấu

Đánh dấu

Quyền viết bài