Để có số liệu thống kê chính xác về khai cuộc thì dữ liệu ván đấu phải hội đủ các yếu tố:
- Mới , updates: nghĩa là các ván đấu càng gần đây càng có giá trị hơn những ván xa xưa vì càng ngày tri thức khai cuộc cờ tướng càng được bổ sung hoàn thiện hơn nên các khai cuộc đương đại sẽ chính xác hơn...
- Tín thực:
Tức là dữ liệu đủ sức để tin tưởng là có khả năng bao quát hay ko:
vd: phải có đủ các giải trong và ngoài nước, đủ mọi cấp bậc A 1, A 2. Giả sử
Nếu chỉ lấy các giải Thế giới làm dữ liệu thì sẽ rất phiến diện vì khai cuộc các kỳ thủ tham dự giải thế giới trong đó có cả các nước ko chuyên về cờ tướng sẽ rất khác khai cuộc các kỳ thủ khi tham dự giải cá nhân Trung Quốc .

Về số lượng các ván đấu không phải là yếu tố chính để khảo sát, ko phải nhiều ván thì sẽ cho kết quả chính xác hơn . Vấn đề là phải có phương pháp "chọn mẫu" chọn những ván đấu tiêu biểu mà kết quả quyết định ở khai cuộc. Vì có những ván đấu khai cuộc kém thế nhưng do kỹ năng trung tàn hay do sai sót của đối thủ nên kết quà cuối cùng ngược lại thì kết quả ván đấu có khi ko trùng khớp với kết quả của khai cuộc.

- Sau cùng là thao tác thống kê: có nhiều thao tác để thống kê, thao tác dùng phần mềm thống kê có lẽ nhanh và hữu hiệu nhất mà ngày nay các ngành khoa học cần nghiên cứu thống kê như xã hội học, dân tộc học hay dùng là phương pháp dùng phần mềm SPSS.
Còn rất nhiều phương pháp nữa, nhưng mà trong web này ắt hẳn có nhiều người giỏi kỹ năng IT nên MV007 xin nhường lại cho họ hướng dẫn thêm.