Useragent - поисковый робот, можно каждый поисковик настроить на индексацию разных страниц.
Allow - страницы, разрешённые к индексации. Можно не указывать, если сканировать нужно все страницы, кроме указанных в disallow.
Disallow - разделы, запрещённые к индексации. Ненужные страницы лучше всего запретить к индексированию, так как поисковый робот за один раз забирает определённое количество страниц. И будет не очень хорошо, если вместо страниц с новостями он решит обновить статистику или опросы.
Host - новый домен (если есть).
* - любой