Не уверен, что по месту пост. Если админы считают иначе - можно вынести в отдельный топик.
Написал скрипт для анализа времени подгрузки основного батча под засланца.
Суть:
В качестве параметра отдаю скрипту номер засланца. Методом нехитрого расчета (сколько в среднем в час принимается фотографий, с погрешностью на отлупы - все среднепотолочно) определяется диапазон номеров для мониторинга: с номера - 3999 по номер - 3000. Предполагается, что когда начинается активность приемки в этом диапазоне - надо подгружать основной батч.
Детали:
анализируется текст страницы
http://www.shutterstock.com/pic.mhtml?id=№Возможны три варианта:
1. находится текст
This image pending approval or doesn't exist - самый неочевидный вариант
2. находится текст
This image is no longer available - это режект
3. не находится текст
photo-error - фота принята.
Результат удручающий. Или, скорее, неочевидный. (см. п.1)
Во-первых - в диапазоне анализируемых номеров (334 файла) при первом же просчете (10:50 Мск) оказалось 32 режектнутых файла и 3 принятых. Но это можно как раз на чью-то подгрузку списать.
Во-вторых - динамика вялая и не отображающая действительности:
- 11:20 - 4 изменения состояния
- 11:55 - 0
- 13:00 - 12
- 13:30 - 3
- 14:12 - 2
- 15:40 - 24 !!!
- 16:00 - 0
- 16:36 - 8
- 17:05 - 0 Этот просчет делался по факту приемки засланца.
Один обнадеживающий факт - всплеск приходится как раз на время, опытно-теоретическим путем определенное для досылки основного батча - примерно за полтора часа до приемки.
Но! На момент приемки из 334 файлов, находящихся "раньше" в очереди на 1000-1333 позиций (3000-3999 номеров) были приняты - 19, режектнуты - 65, не приняты или удалены - 250. Кстати, наблюдался факт перехода состояния "режект" в "неопределенный" - т.е. факт удаления отвергнутого файла.
Сегодня утром запустил скрипт с теми же параметрами (ну не был я уверен в достоверности полученных результатов) - все гораздо более очевидно: принятых - 147, режектнутых - 126, с неопределенным статусом (думаю, это все уже удаленные файлы, хотя может быть есть раздолбай инспектор...) - 61. Гораздо более объективно!
Резюме:
Налицо большой разброс. И информация получаемая подобным образом очень мало помогает в борьбе за удачную индексацию

Возможно, имеет место обсуждаемый здесь "территориальный признак".
Тем более, что второй день налицо явный инсайд

По крайней мере, в категории бьюти/фэшн. На первых позициях некто Slavko Sereda с большой кучей эдиториальной репортажки с киевской фэшн сейшн... Мои вроде очень удачно по времени попали - приемка в 1:04 Мск - но в самом подвале первой страницы (25 строк). Причем попали скорее "вопреки", чем "благодаря"...

После того, как описанный эксперимент провалился (хотя - отрицательный результат - тоже результат), быстренько поставил в очередь нового засланца, на удачу. Перед сном, в 22 Мск. кинул вслед небольшой батч. И почти попал...
28894... Очередь 17:16 принято 1:01 время - 7:45
ЗЫ Диапазон исследуемых номеров: 28866508 - 28867507, номер, для которого велось исследование 28870507