Una IA ha tenido que comprar 10,000 Magikarp para avanzar en Pokémon Rojo. Nos estaba imitando

una ia ha tenido que comprar 10,000 magikarp para avanzar en pokémon rojo. nos estaba imitando

Una IA ha tenido que comprar 10,000 Magikarp para avanzar en Pokémon Rojo. Nos estaba imitando

La inteligencia artificial es, muy probablemente, una de las herramientas más importantes que alguna vez haya creado la humanidad. Pocas cosas pueden compararse con ella; la rueda o la imprenta serían de nuestros primeros pensamientos, pero solo podemos estar seguros de una cosa: a día de hoy, no hay una más popular que la IA.

Es por ello que este tipo de software se ha llevado a diversos campos del conocimiento y entretenimiento, como lo son los videojuegos. Y es que Peter Whidden, un programador que ha trabajado en proyectos dirigidos por el CERN, se ha dedicado los últimos meses a entrenar una inteligencia artificial para que juegue ‘Pokémon Red’.

En total, Whidden ha entrenado su algoritmo de machine learning por más de 50,000 horas, muchas de ellas gastadas en resolver errores de programación y situaciones inesperadas a la hora de ejecutar el código. Esto le ha valido amasar unas 20,000 partidas jugadas por su inteligencia artificial y gastar un aproximado de 1,000 dólares.

La base de su aprendizaje es visión computacional, pues analiza imágenes del juego para tomar sus decisiones. Así lo compartió a través de un video en YouTube.

Aprendizaje por Refuerzo y sistemas de recompensas

una ia ha tenido que comprar 10,000 magikarp para avanzar en pokémon rojo. nos estaba imitando

Pokemon 01

Vale la pena mencionar que el entrenamiento se llevó a cabo utilizando una técnica llamada Reinforcement Learning o Aprendizaje por Refuerzo. Bajo este enfoque, un agente inteligente aprende a tomar decisiones que le ayudarán a maximizar una recompensa. Esto significa que el software no fue entrenado indicándole las directrices que debía seguir para aprender a replicarlas o mejorarlas, sino que ajustó su aprendizaje para obtener más recompensas y minimizar las penalizaciones.

Whidden se encargó de asignar un sistema de puntaje específico a diversas acciones. Si la IA gana una batalla, entonces gana tres puntos, si logra conquistar un gimnasio se lleva cinco puntos y si captura un Pokémon obtiene un punto. Así, la IA inició su camino por el mundo de ‘Pokémon Rojo’, y tardó bastante en salir de Pueblo Paleta, aunque al salir del lugar se encontró con su primer gran problema: los NPC.

Como la IA aprende a partir de imágenes o frames del juego, cuando se encontró con un lugar con NPC que caminaban de un lado a otro, el sistema interpretaba cada cambio de posición de los personajes de relleno como un nuevo cuadro lleno de información importante. Por lo que Whidden necesitó ajustar su programación para evitarlo, asignando una nueva etiqueta a los cuadros.

Además, surgió otra problemática. La exploración también obtenía recompensa y eso provocó que la IA evitara los combates, pues su agregado de exploración era nulo. Para compensar este hueco, Whidden decidió que sumaría más puntos de recompensa si el rival tenía Pokémon más poderosos. Con ello, el software también comenzó a aprender cosas nuevas, como que evolucionar Pokémon le beneficiaba para ganar combates, pues hasta ese momento no había mostrado interés por hacerlo.

Eventos traumáticos y estafas

una ia ha tenido que comprar 10,000 magikarp para avanzar en pokémon rojo. nos estaba imitando

Pokemon 02

Otra de las partes interesantes fue cómo esta red neuronal experimentaba “eventos traumáticos”, pues en más de una ocasión le ocurrió que puso a todos sus Pokémon en una computadora del Centro Pokémon. Esto le reducía los puntos enormemente, a tal grado que desarrolló una especie de “aversión” por aquellos lugares y finalmente dejó de frecuentarlos por completo. Cuando logró corregir este bug, Whidden realizó un interesante análisis al respecto.

“Hasta este punto, la IA ha tenido un gran éxito utilizando sólo los movimientos primarios y ha aprendido a confiar exclusivamente en ellos. Ahora necesita utilizar algo más. Esta cuestión puede parecer trivial, pero incluso los seres humanos luchan con el mismo problema fundamental. Nuestra experiencia y nuestros prejuicios nos ayudan a tomar decisiones y a resolver problemas más rápidamente, pero también limitan nuestro pensamiento y obstaculizan nuestra capacidad para abordar un problema desde un nuevo ángulo”.

Del mismo modo, la IA tardó 300 días de tiempo simulado para lograr vencer a Brock, descifrando que podía utilizar Pokémon y ataques tipo agua para derrotar a los tipo roca. El mismo Whidden estaba sorprendido de los resultados, pues admite que nunca pensó que su creación podría llegar a derrotar a un líder de gimnasio.

Pero la anécdota más curiosa, y al mismo tiempo graciosa, fue cuando la IA compró 10,000 Magikarp, cada uno a 500 Pokécuartos. Bueno, no los compró de un solo golpe, pues solo puedes adquirir uno por partida, pero en 10,000 partidas que se encontró al vendedor, todas terminaron con ella cayendo en la estafa.

una ia ha tenido que comprar 10,000 magikarp para avanzar en pokémon rojo. nos estaba imitando

Pokemon Ia Pokemon Rojo 01

La compra constante de Magikarps se asemeja, según lo explicado por Whidden, a como nosotros los humanos realizamos acciones que son negativas para nuestro impacto personal pero beneficiosas para ciertos objetivos fundamentales, como no pasar hambre. La imagen anterior demuestra esa comparativa, en la que las personas pueden comprar comida rápida y poco saludable para cumplir con sobrevivir, pese a los problemas de salud que ingerir constantemente ese tipo de comida nos puede provocar.

Algunas conclusiones

Después de todo el tiempo de entrenamiento, Whidden pudo notar evidentes patrones en el comportamiento de la IA. Para comenzar, exploraba los escenarios siempre en sentido antihorario, comenzando por las esquinas. A ello se le suma que este programa pudo identificar las condiciones necesarias para que la primera Pokéball con la cual capturar un Pokémon tuviera el resultado de una Master Ball, es decir, nunca errar en el encuentro con Pokémon salvajes.

Whidden también compartió una gráfica con la cantidad de veces que la IA capturó un Pokémon, demostrando cuáles eran los que más le interesaban o con los que más se encontraba.

una ia ha tenido que comprar 10,000 magikarp para avanzar en pokémon rojo. nos estaba imitando

Pokemon Capturados

Este trabajo fue realmente impresionante, pues Whidden demostró cómo puede aplicarse una IA para jugar videojuegos como ‘Pokémon Rojo’. Sería interesante ver hasta dónde pueden llegar con las capacidades tecnológicas y computacionales que tenemos. Algo que me llamaría especial atención sería una que pudiera manejarse por los universos de ‘Breath of the Wild’ o ‘Tears of the Kingdom’, los cuales están llenos de problemas físicos y de varias de posibilidades para resolverlos.

Sea como fuere, este proyecto ha sido muy gratificante para su desarrollador y demasiado interesante como para pasar desapercibido. La mejor parte es que Whidden parece no tener intenciones de dejar el proyecto hasta este punto, por lo que podríamos ver más sobre ello en el futuro.

La noticia Una IA ha tenido que comprar 10,000 Magikarp para avanzar en Pokémon Rojo. Nos estaba imitando fue publicada originalmente en Xataka México por César Aguilla .

OTHER NEWS

21 minutes ago

Tennis-Jarry becomes first Chilean to reach Masters 1000 final in 17 years

21 minutes ago

14-man Lions stun Glasgow Warriors to stay in playoff race while Ospreys pip Dragons to stay alive

21 minutes ago

Lynch: Scottie Scheffler’s scandal shows why the PGA Tour has to look elsewhere for much-needed spice

21 minutes ago

Alice Stewart, CNN political commentator and veteran political adviser, dies at 58

21 minutes ago

Succession drama grips Gucci as sales fail to make the cut

21 minutes ago

Virgin Voyages free cruise winner says prize will cost her $8,000 in flights after Virgin ends Australian cruises

21 minutes ago

Chelsea women rout United to win 5th straight title as manager Emma Hayes exits for US

21 minutes ago

Seize the Grey wins the 2024 Preakness Stakes

21 minutes ago

Simple Test May Predict Whether Your Child Will Outgrow Their Peanut Allergy

21 minutes ago

Usyk Drops Fury, Becomes Undisputed Champ!

21 minutes ago

Tributes Pour in for CNN Commentator Alice Stewart, Dead at 58

21 minutes ago

Gabby Douglas out of US Classic after one event. What happened and where she stands for nationals

21 minutes ago

Johor police station attack: S’pore steps up security measures, including at checkpoints

21 minutes ago

Israel's Gantz demands day-after plan for Gaza by June 8, threatens to quit Cabinet

21 minutes ago

Singapore facing new Covid-19 wave; vaccination recommended especially for seniors: Ong Ye Kung

21 minutes ago

askST: Are sentences in $3 billion money laundering case short relative to the sums involved?

22 minutes ago

Archbishop of Canterbury criticises two-child benefit cap as ‘cruel’

22 minutes ago

British companies should ditch political activism, says Kemi Badenoch

22 minutes ago

Madonna's biggest-ever concert transforms Rio's Copacabana beach into a massive dance floor

22 minutes ago

Young Sheldon Season 7: The Tragic George Funeral Twist, Explained

23 minutes ago

Tomball ISD teachers fired, accused of unprofessional behavior with students in autism program

26 minutes ago

Candid Aussie reveals surprise job that pays $50 an hour - and only requires one week of training and no degree

27 minutes ago

Kourtney Kardashian, 45, reminisces about 'college Kourt' as she shares 1998 throwback from freshman year

27 minutes ago

Kanye West, 46, and wife Bianca Censori, 29, stop at Denny's for low-key dinner date - amid claims her family fear he will 'drag her' into his porn venture

28 minutes ago

Tottenham ace Dejan Kulusevski sends fans message after Ange Postecoglou's 'foundations' claim

28 minutes ago

Unai Emery hatches Aston Villa plan for exciting Jhon Duran amid Chelsea transfer interest

28 minutes ago

More people are turning 65 this year than ever before. That has sparked a gold rush for the retirement industry

28 minutes ago

Nadhim Zahawi says it was a mistake for Tories to force Boris Johnson from No 10

28 minutes ago

Seize The Grey carries the day at the 2024 Preakness

28 minutes ago

Ex-con who allegedly attacked autistic NYC Stop & Shop worker, 20, released without bail: ‘Innocent people suffer’

28 minutes ago

People are outraged by dad's viral ‘hacks' for saving money on kids' meals at restaurants

28 minutes ago

Summer McIntosh swims world's fastest time of year in 200m butterfly, qualifies for Paris Olympics

28 minutes ago

A group of college kids may have just figured out how to get leaf blowers to shut up

28 minutes ago

The Okanagan bracing for the potential of an extremely dry summer season

28 minutes ago

PGA Championship: Fan strips down to retrieve golfer Adam Hadwin’s club from water

28 minutes ago

Inter Miami vs. DC United live score, result, updates, stats with Lionel Messi's MLS match delayed

28 minutes ago

Trump hits Biden for blaming ‘disaster’ inflation on shrinking size of Snickers Bars

28 minutes ago

Most Selfish Nintendo Characters

28 minutes ago

Tyson Fury vs. Oleksandr Usyk live updates: Round-by-round fight analysis, highlights

28 minutes ago

Colorado's Shedeur Sanders warns former teammate after critical comments

Kênh khám phá trải nghiệm của giới trẻ, thế giới du lịch