Hi to all,
I have a question to ask at experts of tests between chess engines:
Are reliable tests doing the play two chess engine at fixed depth?
They can be useful to determinates the real strength of a chess engine?
Saludos
Test at fixed depth
Moderator: Ras
-
shrapnel
- Posts: 1339
- Joined: Fri Nov 02, 2012 9:43 am
- Location: New Delhi, India
Re: Test at fixed depth
Did you use Google Translator to write this post ?
Just curious....
Just curious....
i7 5960X @ 4.1 Ghz, 64 GB G.Skill RipJaws RAM, Twin Asus ROG Strix OC 11 GB Geforce 2080 Tis
-
Alpha-Team
- Posts: 3
- Joined: Wed Mar 04, 2015 8:08 pm
Re: Test at fixed depth
Unfortunately yes. Is unclear the question?shrapnel wrote:Did you use Google Translator to write this post ?
Just curious....
-
Ozymandias
- Posts: 1537
- Joined: Sun Oct 25, 2009 2:30 am
Re: Test at fixed depth
The first one more than the second, but in any case, fixed depth leaves out time management, which is an important aspect of an engine's strength. In that sense, it can't be used to determine "the real strength of a chess engine".
Also, take into account that different engines, take more or less time, to reach the same depth.
Also, take into account that different engines, take more or less time, to reach the same depth.
-
Ajedrecista
- Posts: 2189
- Joined: Wed Jul 13, 2011 9:04 pm
- Location: Madrid, Spain.
Re: Test at fixed depth.
Hello Alejandro:
Just in case you have doubts with English language, I will write in Spanish (but an answer in English was needed for not being impolite with the rest of people).
------------
Hola Alejandro:
Escribo también en español/castellano (como prefieras) por si así lo entiendes mejor, pero era necesario que escribiese en inglés para no ser mal educado con el resto de gente.
No soy un experto probando programas pero puedo decirte que cada programa cuenta los nodos de manera diferente y lo mismo pasa con la profundidad nominal de búsqueda. La única utilidad que veo en este tipo de pruebas es intentar medir la ganancia en Elo de un determinado programa (es decir, enfrentar el programa X a una profundidad P contra el mismo programa X (no otro por lo que he escrito anteriormente) a una profundidad distinta de P). Cuantas más partidas se jueguen mejor pues los errores serán menores (en primera aproximación el error es inversamente proporcional a la raíz cuadrada del número de partidas) pero también lleva más tiempo, así que hay que encontrar un compromiso entre las dos cosas... depende de cada persona. Este tipo de pruebas serviría para intentar estimar cuánto Elo se gana con cada profundidad de más, que cada vez va a ser menor (ley de los rendimientos decrecientes). Recomiendo la búsqueda "diminishing returns" en inglés (para que obtengas resultados) en TalkChess: hay varios ejemplos. Yo mismo hice una prueba así hace unos pocos años.
Espero que te sirva mi respuesta.
Un saludo.
------------
Regards from Spain.
Ajedrecista.
I am not an expert but I can say that different engines count nodes in different ways and the same applies with depth. The only use I see with tests at fixed depth is trying to measure Elo gains (but there are also uncertainties: more games ---> less error) of a certain engine and thus trying to estimate a law for diminishing returns. You can search 'diminishing returns' in TalkChess and you are going to find several examples (I did one a few years ago).Alpha-Team wrote:Hi to all,
I have a question to ask at experts of tests between chess engines:
Are reliable tests doing the play two chess engine at fixed depth?
They can be useful to determinates the real strength of a chess engine?
Saludos
Just in case you have doubts with English language, I will write in Spanish (but an answer in English was needed for not being impolite with the rest of people).
------------
Hola Alejandro:
Escribo también en español/castellano (como prefieras) por si así lo entiendes mejor, pero era necesario que escribiese en inglés para no ser mal educado con el resto de gente.
No soy un experto probando programas pero puedo decirte que cada programa cuenta los nodos de manera diferente y lo mismo pasa con la profundidad nominal de búsqueda. La única utilidad que veo en este tipo de pruebas es intentar medir la ganancia en Elo de un determinado programa (es decir, enfrentar el programa X a una profundidad P contra el mismo programa X (no otro por lo que he escrito anteriormente) a una profundidad distinta de P). Cuantas más partidas se jueguen mejor pues los errores serán menores (en primera aproximación el error es inversamente proporcional a la raíz cuadrada del número de partidas) pero también lleva más tiempo, así que hay que encontrar un compromiso entre las dos cosas... depende de cada persona. Este tipo de pruebas serviría para intentar estimar cuánto Elo se gana con cada profundidad de más, que cada vez va a ser menor (ley de los rendimientos decrecientes). Recomiendo la búsqueda "diminishing returns" en inglés (para que obtengas resultados) en TalkChess: hay varios ejemplos. Yo mismo hice una prueba así hace unos pocos años.
Espero que te sirva mi respuesta.
Un saludo.
------------
Regards from Spain.
Ajedrecista.
-
Alpha-Team
- Posts: 3
- Joined: Wed Mar 04, 2015 8:08 pm
Re: Test at fixed depth.
Thank you very much for your response and your availability.Ajedrecista wrote:Hello Alejandro:
I am not an expert but I can say that different engines count nodes in different ways and the same applies with depth. The only use I see with tests at fixed depth is trying to measure Elo gains (but there are also uncertainties: more games ---> less error) of a certain engine and thus trying to estimate a law for diminishing returns. You can search 'diminishing returns' in TalkChess and you are going to find several examples (I did one a few years ago).Alpha-Team wrote:Hi to all,
I have a question to ask at experts of tests between chess engines:
Are reliable tests doing the play two chess engine at fixed depth?
They can be useful to determinates the real strength of a chess engine?
Saludos
Just in case you have doubts with English language, I will write in Spanish (but an answer in English was needed for not being impolite with the rest of people).
------------
Hola Alejandro:
Escribo también en español/castellano (como prefieras) por si así lo entiendes mejor, pero era necesario que escribiese en inglés para no ser mal educado con el resto de gente.
No soy un experto probando programas pero puedo decirte que cada programa cuenta los nodos de manera diferente y lo mismo pasa con la profundidad nominal de búsqueda. La única utilidad que veo en este tipo de pruebas es intentar medir la ganancia en Elo de un determinado programa (es decir, enfrentar el programa X a una profundidad P contra el mismo programa X (no otro por lo que he escrito anteriormente) a una profundidad distinta de P). Cuantas más partidas se jueguen mejor pues los errores serán menores (en primera aproximación el error es inversamente proporcional a la raíz cuadrada del número de partidas) pero también lleva más tiempo, así que hay que encontrar un compromiso entre las dos cosas... depende de cada persona. Este tipo de pruebas serviría para intentar estimar cuánto Elo se gana con cada profundidad de más, que cada vez va a ser menor (ley de los rendimientos decrecientes). Recomiendo la búsqueda "diminishing returns" en inglés (para que obtengas resultados) en TalkChess: hay varios ejemplos. Yo mismo hice una prueba así hace unos pocos años.
Espero que te sirva mi respuesta.
Un saludo.
------------
Regards from Spain.
Ajedrecista.
(Muchas gracias por tu respuesta y por tu disponibilidad...)
Saludos