Тут скорее не ваш баг, а общий, т.к. в сапе и в clx робот тоже самое.
Фишка такая - сайт на WordPress, страниц там за 4500, которые были в индексе (по крайней мере до того как от безнадежности сменил ЧПУ на обычне ссылки). Так вот. Робот сапы нашел только главную, робот clx 4, и на индексации уже фик знает сколько времени еще 74, ваш робот нашел три страницы.
Похожие ситуации (но не такая плачебная) с другими сайтами на wordpress (utf8), сайты с win1251 - все ок.

Так вот, может вы подскажете, в чем может проблема, неужели в кодировке utf8?

Ссылку тут светить не хочу, скинуть в личку по запросу могу.
id площадки вроде как 2748.