Na przełomie kwietnia i maja w Vancouver odbyła się konferencja Sixth International Conference on Learning Representations poświęcona sztucznej inteligencji. Nie zabrakło na niej przedstawicieli Google, którzy zaprezentowali najnowszy algorytm oparty o Reinforcement Learning służący do zwracania adekwatnych wyników wyszukiwania na zapytania wpisywane przez użytkowników.
Maszynowe uczenie w algorytmie Google
Google chce dostarczać dokładniejsze odpowiedzi na zapytania użytkowników. W tym celu korzysta z machine learning, aby udoskonalić mechanizm wyszukiwarki. Nowy algorytm będzie pośrednikiem pomiędzy użytkownikiem a tradycyjnym algorytmem tworzącym listę wyników wyszukiwania na podstawie czynników rankingowych. Ma działać zupełnie niezależnie i na zasadzie uczenia przez wzmacnianie (Reinforcement Learning) zwracać internautom lepiej dopasowane strony. Sposób działania nowej technologii Google został opisany w artykule: Ask The Right Questions: Active Question Reformulation with Reinforcement Learning.
Na czym polega Reinforcement Learning?
Reinforcement Learning (uczenie przez wzmacnianie) to metoda należąca do machine learning stosowania do rozwiązywania problemów, w przypadku których nie można skorzystać z modeli analitycznych. Nawiązuje do psychologii behawioralnej i teorii wzmocnienia – wyrabiania prawidłowych wzorców zachowań poprzez kary oraz nagrody.
Uczenie przez wzmacnianie polega na tym, że agent (np. algorytm wyszukiwarki) działając w określonym środowisku (np. wyszukiwarce), podejmuje z nim interakcje. Wynik każdej akcji może być negatywny (niekliknięcie przez użytkownika w żaden z wyników wyszukiwania) lub pozytywny (przejście na jedną z zaproponowanych przez wyszukiwarkę stron). Na podstawie wszystkich interakcji agent tworzy określoną politykę, wzorzec postępowania w określonym środowisku, które gwarantuje sukces.
Proces Reinforcement Learning można porównać do nauki jazdy na rowerze. Jeśli dziecko będzie przechylać się za bardzo na lewą lub prawą stronę, nie utrzyma równowagi i upadnie. Na zasadzie prób i błędów w końcu uda mu się dobrać odpowiednią pozycję, dzięki której pojedzie samodzielnie na jednośladzie.
Jak będzie działać algorytm oparty o uczenie przez wzmacnianie?
Użytkownik wpisuje frazę do wyszukiwarki. Algorytm uczenia maszynowego (agent) przekształca zapytanie na wiele różnych pytań, a następnie przesyła je do tradycyjnego algorytmu opartego na czynnikach rankingowych. Na podstawie zwróconych odpowiedzi, nowy algorytm wykonuje wstępną selekcję i wysyła zagregowaną listę stron użytkownikowi.