КЛУБ СТОКОВЫХ ФОТОГРАФОВ, ИЛЛЮСТРАТОРОВ, ВИДЕОГРАФОВ и ИИ-ШНИКОВ http://zastavkin.com/forum/ |
|
Популярные Keywords http://zastavkin.com/forum/viewtopic.php?f=11&t=3790 |
Страница 1 из 1 |
Автор: | iNNOCENt [ 09 11 2007, 09:59 ] |
Заголовок сообщения: | Популярные Keywords |
Добрый день, Возникла такой вопрос - а нет ли возможности понять, по каким Keywords больше всего "выходят" на мои фотки? Или, может чуть проще, как бы понять, какие keywords используются для поиска наиболее часто, желательно динамически обновляемого, вроде Most Popular Keywords на Dreamstime, только список поболее? Может есть где сервис по сбору данной информации или может можно написать подобный (по сбору с того же Dreamstime)? Что бы он, например, с определённой периодичностью брал информацию с того же Dreamstime, закачивал её в базу, да ещё и рейтинг бы какой-нить составлял? |
Автор: | Юрий Христич [ 09 11 2007, 11:40 ] |
Заголовок сообщения: | Re: Популярные Keywords |
iNNOCENt писал(а): а нет ли возможности понять, по каким Keywords больше всего "выходят" на мои фотки?
Хех. Это была чертовски полезная информация... |
Автор: | Dizeloid [ 09 11 2007, 11:43 ] |
Заголовок сообщения: | Re: Популярные Keywords |
Юрий Христич писал(а): iNNOCENt писал(а): а нет ли возможности понять, по каким Keywords больше всего "выходят" на мои фотки? Хех. Это была чертовски полезная информация... +1 |
Автор: | Rellas [ 09 11 2007, 13:04 ] |
Заголовок сообщения: | |
а чем шаттеровский топ не устраивает? http://submit.shutterstock.com/top100kw.mhtml |
Автор: | iNNOCENt [ 09 11 2007, 14:02 ] |
Заголовок сообщения: | |
Rellas писал(а):
Сотни слов - маловато будет... Хотелось бы, чтобы при подборе ключевых слов для конкретной фотографии, можно было посмотреть популярность каждого слова, да ещё и отсортировать их по популярности (для той же Фотолии, например). А в Top-100 даже десятки слов конкретной тематики скорее всего не наберётся. Ещё было бы полезно вести некую статистику по словосочетаниям/комбинациям слов в поиске. То есть, при добавлении, например, слова beach в keywords, чтобы что-то подсказывало, что с этим словом, например чаще всего в поиске используются слова palm, sand, sun, etc... Такую статистику можно было бы ИМХО собрать автоматически мониторя Recent Keywords Search на том же Dreams... В идеале бы всю эту ерунду привязать к сервису для подбора ключевых слов - цены бы ему тогда не было... |
Автор: | shalex84 [ 09 11 2007, 14:43 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): Rellas писал(а): Сотни слов - маловато будет... Хотелось бы, чтобы при подборе ключевых слов для конкретной фотографии, можно было посмотреть популярность каждого слова, да ещё и отсортировать их по популярности (для той же Фотолии, например). А в Top-100 даже десятки слов конкретной тематики скорее всего не наберётся. Ещё было бы полезно вести некую статистику по словосочетаниям/комбинациям слов в поиске. То есть, при добавлении, например, слова beach в keywords, чтобы что-то подсказывало, что с этим словом, например чаще всего в поиске используются слова palm, sand, sun, etc... Такую статистику можно было бы ИМХО собрать автоматически мониторя Recent Keywords Search на том же Dreams... В идеале бы всю эту ерунду привязать к сервису для подбора ключевых слов - цены бы ему тогда не было... такую статистику может тока сам банк давать, никакой сторонний сервис не сможет отследить забросы юзверей на банке, тем более вести статистику. |
Автор: | Dizeloid [ 09 11 2007, 15:21 ] |
Заголовок сообщения: | |
Rellas писал(а):
Топ это на сколько я понимаю статистика по кейвордам которые забивают фотографы, а автор топика хочет статистику кейвордов или другими словами поисковых слов которые забивают покупатели в поиск. Это несколько разные вещи. И статистика почти уверен разная. |
Автор: | iNNOCENt [ 09 11 2007, 15:22 ] |
Заголовок сообщения: | |
Цитата: такую статистику может тока сам банк давать, никакой сторонний сервис не сможет отследить забросы юзверей на банке, тем более вести статистику.
На том же Dreams есть последние Keywords использовавшихся при поиске. Мне представляется, что достаточно не сложно написать небольшого "робота", к-й с определённой периодичностью заглядывал туда и сохранял эти слова в базу (добавлял бы новые слова) и прибавлял бы +1 к счётчику популярности существующих слов. Так же, поскольку на Dreams отображаются целиком последние запросы, то можно и статистику по комбинациям слов сохранять. |
Автор: | elesus [ 09 11 2007, 15:57 ] |
Заголовок сообщения: | |
Мне было бы интереснее узнать другой коефициент: кол-во запросов по конкретному слову/кол-во результатов Например: слово "christmas" ищут в день 1000 раз, а результатов скажем 10000, значит наш коеф. 1000/10000 = 0,1 В то же время слово "blond" ищут тоже 1000 раз в день, а результатов скажем 5000, значит коеф. 1000/5000 = 0,2 Значит потенциально блондинок будут покупать в два раза чаще, чем Рождественскую тематику. (все цифры с потолка).... п.с. вот только одкуда взять всю эту статистику.... ![]() |
Автор: | Dizeloid [ 09 11 2007, 16:04 ] |
Заголовок сообщения: | |
Думаю внутри у Шаттера эта статистика есть. Но было бы не правильно её выносить на всеобщее обозрение. Иначе блондинки и кристмасс будут в каждой второй фотке. |
Автор: | lahtak [ 09 11 2007, 16:20 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): Цитата: такую статистику может тока сам банк давать, никакой сторонний сервис не сможет отследить забросы юзверей на банке, тем более вести статистику. На том же Dreams есть последние Keywords использовавшихся при поиске. Мне представляется, что достаточно не сложно написать небольшого "робота", к-й с определённой периодичностью заглядывал туда и сохранял эти слова в базу (добавлял бы новые слова) и прибавлял бы +1 к счётчику популярности существующих слов. Так же, поскольку на Dreams отображаются целиком последние запросы, то можно и статистику по комбинациям слов сохранять. А где они находятся , что-то не видно мне этих последних Keywords |
Автор: | iNNOCENt [ 09 11 2007, 17:04 ] |
Заголовок сообщения: | |
lahtak писал(а): iNNOCENt писал(а): Цитата: такую статистику может тока сам банк давать, никакой сторонний сервис не сможет отследить забросы юзверей на банке, тем более вести статистику. На том же Dreams есть последние Keywords использовавшихся при поиске. Мне представляется, что достаточно не сложно написать небольшого "робота", к-й с определённой периодичностью заглядывал туда и сохранял эти слова в базу (добавлял бы новые слова) и прибавлял бы +1 к счётчику популярности существующих слов. Так же, поскольку на Dreams отображаются целиком последние запросы, то можно и статистику по комбинациям слов сохранять. А где они находятся , что-то не видно мне этих последних Keywords http://www.dreamstime.com/latest-photos Справа, 1/3 экрана снизу, секция "Recent Searches". Как видите, там показаны запросы, даже не просто отдельные слова. По ним, при условии автоматизации сбора этой информации, можно строить статистику как отдельно слов, так и словосочетаний. |
Автор: | shalex84 [ 09 11 2007, 18:52 ] |
Заголовок сообщения: | |
Счас подумаю, если договорюсь с другом о php хостинге, может ченить и придумаю по дримсу.... вешь реальная, тока вот в каком виде отображение делать? две колонки: самые популярные, и рейтинг, или как? пока рейтинг наберется, много времени пройдет... или может сделать, с выбором за неделю, месяц, день, час??? |
Автор: | Slonov [ 09 11 2007, 19:45 ] |
Заголовок сообщения: | |
lahtak писал(а): iNNOCENt писал(а): Цитата: А где они находятся , что-то не видно мне этих последних Keywords Сергей! Сделай макрос в экселе. Что бы скидывал время от времени слова в новые ячейки. А я обязуюсь запускать его, обрабатывать и публиковать данные. Самому сейчас уже не сообразить. |
Автор: | lahtak [ 09 11 2007, 21:47 ] |
Заголовок сообщения: | |
Slonov писал(а): lahtak писал(а): iNNOCENt писал(а): Цитата: А где они находятся , что-то не видно мне этих последних Keywords Сергей! Сделай макрос в экселе. Что бы скидывал время от времени слова в новые ячейки. А я обязуюсь запускать его, обрабатывать и публиковать данные. Самому сейчас уже не сообразить. Я макросы лет 5 не писал , но сделаю такой считыватель на другом движке. Только кажись оно редко обновляется . Тут интересно проанализировать устойчивые словосочетания и их повторяемость |
Автор: | Slonov [ 09 11 2007, 22:02 ] |
Заголовок сообщения: | |
lahtak писал(а): Я макросы лет 5 не писал , но сделаю такой считыватель на другом движке. Только кажись оно редко обновляется . Тут интересно проанализировать устойчивые словосочетания и их повторяемость
Да, обновляется редко - сейчас посмотрю сколько. Ну и пускай. Будем загружать через равные промежутки времени - будет репрезентативная выборка. Обновляется раз в десять минут, выдает 21 словосочетание. Итого 3000 словосочетаний в день, больше 6000 слов. Немного, но хватит. |
Автор: | lvinst [ 09 11 2007, 23:11 ] |
Заголовок сообщения: | |
Собирать статистику по "Recent Searches" -- не оченеь интересно. По моим наблюдениям там выводятся только те запросы, для которых мало или совсем нет изображений в базе дримса. Больший интерес представляеет статистика популярных слов, которая представлена на другой странице. |
Автор: | Zoom [ 09 11 2007, 23:22 ] |
Заголовок сообщения: | |
Ребят, поройтесь в форуме, кажется, кто-то уже выкладывал базу поисковых запросов, и именно на Дримсе.. оклоло года назад.... Дежа Вю у меня ![]() |
Автор: | lahtak [ 10 11 2007, 00:33 ] |
Заголовок сообщения: | |
lvinst писал(а): Собирать статистику по "Recent Searches" -- не оченеь интересно. По моим наблюдениям там выводятся только те запросы, для которых мало или совсем нет изображений в базе дримса.
Больший интерес представляеет статистика популярных слов, которая представлена на другой странице. Специально посмотрел , мягко говоря это не так. |
Автор: | lahtak [ 10 11 2007, 00:38 ] |
Заголовок сообщения: | |
Zoom писал(а): Ребят, поройтесь в форуме, кажется, кто-то уже выкладывал базу поисковых запросов, и именно на Дримсе.. оклоло года назад.... Дежа Вю у меня
![]() Интересно текущее время , пасха от рождества отличается довольно сильно. Потом у меня давно была задумка сделать словарь перекрестных ссылок по ключевым словам. На выходных внук и футбол, с понедельника возьмусь ![]() |
Автор: | iChip [ 10 11 2007, 00:46 ] |
Заголовок сообщения: | |
Как-то начал собирать на Лаки, собрал 6.5 тыс запросов и бросил, вот наиболее популярные запросы из моей выборки: 31 female 23 young 23 girl 22 cute 21 background 19 woman 18 women 18 pretty 17 beautiful 16 white 15 silhouette 14 teen 14 illustration 14 beauty 14 adult 14 abstract 13 natural 13 business 13 art 12 wallpaper 12 summer 12 red 12 model 12 flowers 12 face 12 black 12 backgrounds 11 person 11 isolated 11 hair 11 green 11 girls 11 blue 11 beach 10 stockings 10 redhead 10 legs 10 happy 10 fashion 10 color 10 bedroom 9 smile 9 sky 9 pattern 9 nature 9 lady 9 food 9 eyes 9 design 9 couple 9 brunette 9 blonde 9 blond 8 water 8 vintage 8 texture 8 teenager 8 pose 8 photograph 8 people 8 light 8 landscape 8 healthy 8 glamour 8 forest 8 children 8 bright 8 boy 8 artistic 7 youth 7 yellow 7 winter 7 tree 7 toes 7 striptease 7 portrait 7 paper 7 newest 7 male 7 love 7 lips 7 fun 7 dog 7 college 7 child 7 alluring 6 wedding 6 travel 6 sun 6 sign 6 shadow 6 school 6 rose 6 plant 6 old 6 health 6 guitar 6 glamor 6 foot 6 dress 6 detail 6 dark 6 caucasian 6 border 6 boots 6 asian 6 architecture 6 antique |
Автор: | shalex84 [ 10 11 2007, 01:10 ] |
Заголовок сообщения: | |
постараюсь за выходные сделать, что бы сервер автономно собирал статистику с дримса, смысл будет потипу сервиса подбора ключей, который на miсrostock.ru, тока статистика будет собираться сервером, а пользователю будет выдаваться текущие значения из собраной базы, отсортированые по частоте упоминания... пока сделаю, что бы просто собирало, потом можно будет доделать, в соответствии с пожеланиями, разные сортировки и, впринципе, добавить другие банки.... |
Автор: | WildCat [ 10 11 2007, 02:27 ] |
Заголовок сообщения: | |
shalex84 писал(а): постараюсь за выходные сделать, что бы сервер автономно собирал статистику с дримса
хорошая идея... было бы клево если б можно было посмотреть графики изменения популярности наиболее употребимых слов, чтобы определить момент, когда именно начинается повышение интереса к тем или иным словам (т.е. когда начинать грузить пасху или весну, например ![]() |
Автор: | shalex84 [ 10 11 2007, 02:50 ] |
Заголовок сообщения: | |
WildCat писал(а): shalex84 писал(а): постараюсь за выходные сделать, что бы сервер автономно собирал статистику с дримса хорошая идея... было бы клево если б можно было посмотреть графики изменения популярности наиболее употребимых слов, чтобы определить момент, когда именно начинается повышение интереса к тем или иным словам (т.е. когда начинать грузить пасху или весну, например ![]() впринципе, нет ничего невозможного, главное время и желание ![]() с первым туговато, второе пока есть ![]() |
Автор: | shalex84 [ 11 11 2007, 04:14 ] |
Заголовок сообщения: | |
WildCat писал(а): хорошая идея... было бы клево если б можно было посмотреть графики изменения популярности наиболее употребимых слов, чтобы определить момент, когда именно начинается повышение интереса к тем или иным словам (т.е. когда начинать грузить пасху или весну, например
![]() а в каком виде это преподнести, точнее даже не вид, а "цена деления", тоесть, статистика слов по месяцам, неделям, дням? как мне кажется, всплесков резких не будет, наверное хватит и значений за месяц кто кроме дримса еще "последнии" слова показывает? просто если с разных банков собирать, то процент "весомых" будет лучше выделятся.... |
Автор: | WildCat [ 11 11 2007, 18:54 ] |
Заголовок сообщения: | |
shalex84 писал(а): а в каком виде это преподнести, точнее даже не вид, а "цена деления", тоесть, статистика слов по месяцам, неделям, дням?
неделя будет нормально. месяц все-таки многовато, а день - нет смысла, по-моему. эту статистику можно попробовать скомбинировать с тем что выдает шаттер и айс в недельных топах. правда это чуть посложнее (надо будет вытаскивать ключевые из каждой картинки попавшей в топы), но интереснее... |
Автор: | shalex84 [ 12 11 2007, 04:23 ] |
Заголовок сообщения: | |
во вторник или среду запущу, пусть набивает базу, раз никто не проявил интреса, значит будет база по неделям как предложил WildCat. Пока проблемы с хостингом, бесплатный не подходит по ряду причин, в том числе я не нашел ни одного который мог бы по расписанию запускать php скрипт. Сервер станет на 100% полезным только через год работы. Первый год можно будет угадывать по нарастающим всплескам. Поьлзователям будет доступен чуть позже. Цитата: эту статистику можно попробовать скомбинировать с тем что выдает шаттер и айс в недельных топах. правда это чуть посложнее (надо будет вытаскивать ключевые из каждой картинки попавшей в топы)
сложность только в том, что это первый мой проект на php+SQL раньше писал тока на С++/немного С#. это тоже сделаю, но чуть позже. пока могу сказать, что основные хиты: gerl, boy, men, sexy и с ними связаное.... |
Автор: | iNNOCENt [ 12 11 2007, 11:48 ] |
Заголовок сообщения: | |
На досуге тут подумал о возможном алгоритме сбора и обработки статистики по последним запросам. 1) Некий робот раз в n (10?) минут считывает последние запросы с Dreamstime и сохраняет их в базу. Причём, сохраняется дата и время запроса + целиком запросы (словосочетания), без дробления на слова. 2) Далее, конечный пользователь где-то вводит 2-3 "основных" (т.е. общих слов, таких как beach, sea, summer и т.д.) ключевых слова и определяет период, за который он хотел бы учитывать статистику (вплоть до гибкого поиска с указанием конкретного периода дат). 3) Некая программа дальше лезет в базу и выбирает все запросы за указанный период времени, в которых встречаются указанные ключевые слова. В качестве результатов, получаем некий массив, где кроме указанных основных слов, отбираются так же все слова, используемые вместе с нашими в одном запросе. При этом рассчитываются два рейтинга: - "Абсолютный" рейтинг каждого слова, т.е. количество упоминаний данного слова (не обязательно вместе с нашими основными словами, а вообще в любых запросах) разделенное на общее количество запросов за указаннный период времени (т.е. рейтинг будет в пределах 0<=r<=1) - "Относительный" рейтинг каждого слова, т.е частота его упоминания именно в сочетании с указанными основными словами. Рассчитывается как частота упоминания каждого слова вместе с нашими основными словами, разделенное на общее количество запросов за период (т.е. относительный рейтинг будет тоже в пределах 0<=r<=1, но в большинстве случаев будет меньше абсолютного рейтинга). Иными словами, рейтинг каждый раз считается динамически, в зависимости от условий поиска (указанных основных слов и периода), что позволит получить не некий абстрактный TOP-100, а вполне конкретную подборку наиболее употребимых слов и словосочетаний на заданную тему. 4) Далее пользователю выдаётся список слов с их рейтингами, отсортированных по выбору пользователя либо по абсолютному рейтингу, либо по относительному. Пользователь уже, по своему усмотрению добавляет или не добавляет ключевые слова к своему изображению (понятно, что не всегда в результатах будут слова, подходящие к конкретному изображению), но идя сверху вниз по списку, у нас будет возможность отбирать наиболее популярные слова для своих фото. Мне кажется, что именно относительный рейтинг будет наиболее полезным, т.к. он должен сильно повысить вероятность попадания в результаты поиска по запросам, состоящим из нескольких слов, к-е, в свою очередь, возвращают гораздо меньше результатов. Вот... |
Автор: | shalex84 [ 13 11 2007, 21:27 ] |
Заголовок сообщения: | |
2 iNNOCENt Цитата: 1) Некий робот раз в n (10?) минут считывает последние запросы с Dreamstime и сохраняет их в базу. Причём, сохраняется дата и время запроса + целиком запросы (словосочетания), без дробления на слова. ладно еще дата, а вот что вам даст время запроса, помойму это будет бесполезный параметр. Кроме того, время и дата запроса могут очень сильно разростить базу до неимоверных размеров, что приведет сервис к очень медленной работе. Также время запроса скажет только о том, когда тот или иной дизайнер(и тд) искал карточку, на пример, утром, до обеда или после... Мне кажется, и не тоьлко мне, что оптимально использовать статистику слова за неделю. сразу будут видны всплески и падения таких слов в запросах. Словосочетания добавлю. Цитата: 2) Далее, конечный пользователь где-то вводит 2-3 "основных" (т.е. общих слов, таких как beach, sea, summer и т.д.) ключевых слова и определяет период, за который он хотел бы учитывать статистику (вплоть до гибкого поиска с указанием конкретного периода дат).
С этим проблем не будет, надо только определится с точностью статистики (день или неделя).... А зачем делить на общее количество запросов, ведь количество упоминаний данного запроса за период имеет тот же смысл, чем больше упоминаний, тем веше рейтинг. Ведь во всех случаях будет формироваться топ за промежуток времени, деление ничего не даст. Какая разница, если вам выдаст что слово girl(например) упоминалось за неделю 235 раз, а запросов было 10 345? или вам выдаст рейтинг слова girl 0,0227??? Кроме этого, дримс выдает не все слова, а только либо первые либо последние за прошедшие 10 мин. Еще заметил, что ночью он пару раз обновлял статистику раз в 15 и раз в 20 минут... вроде... |
Автор: | WildCat [ 14 11 2007, 00:53 ] |
Заголовок сообщения: | |
shalex84 писал(а): пока могу сказать, что основные хиты: gerl, boy, men, sexy и с ними связаное....
вот именно поэтому надо привязывать статистику к топу продаж хоть каким-то боком, иначе в результате получится список ключевых слов, наиболее популярных среди... малолетних дрочеров, шарящихся по дриму в поисках ню-шек (и разумеется нифига не покупающих) ![]() интересно не просто запросы, а связка запрос-покупка, т.е. результативные запросы или же, наоборот, запросы абсолютно нерезультативные, т.е. повторяющиеся запросы того, чего в базе пока мало или нет вообще. кста, кол-во фоток на каждый кейворд вроде как тоже можно вытащить на каком-то из стоков (фотолия? дрим?), точно помню что видел эти цифры в момент ввода слов в поле поиска в виде выпадающей подсказки. это тоже крайне важная инфа, и если ее вытащить и скрестить результаты с частотным словарем английского языка, то - уверен - нас ждут очень интересные результаты ![]() понятное дело, сочетания слов в запросе тоже актуально. в общем, для первого проекта задачка весьма серьезная, но при этом чертовски интересная и весьма перспективная - эдакий реалтайм-анализатор тенденций на рынке с возможностью предсказания ![]() |
Автор: | iNNOCENt [ 14 11 2007, 11:05 ] |
Заголовок сообщения: | |
shalex84 писал(а): 2 iNNOCENt
Цитата: 1) Некий робот раз в n (10?) минут считывает последние запросы с Dreamstime и сохраняет их в базу. Причём, сохраняется дата и время запроса + целиком запросы (словосочетания), без дробления на слова. ладно еще дата, а вот что вам даст время запроса, помойму это будет бесполезный параметр. Кроме того, время и дата запроса могут очень сильно разростить базу до неимоверных размеров, что приведет сервис к очень медленной работе. Также время запроса скажет только о том, когда тот или иной дизайнер(и тд) искал карточку, на пример, утром, до обеда или после... Со временем - согласен, погорячился. А вот с датой - можно было бы более гибко задавать период поиска (напр. за день, 3 дня, неделю, месяц, три месяца и т.д.). Хотя, в принципе, это может и излишне. А насчёт размера базы - то тут можно посчитать. Если получится дату сохранять один раз на "сеанс" считывания данных с Dreams (а не для каждого отдельного словосочетания), то 1kb ИМХО будет выши крыши на один "сеанс", что при интервале считывания данных раз в 10 минут нам даёт 144 kb в день или порядка 50MB в год, что мне не представляется ужасным... Кстати, мне кажется было бы полезным не делать сервис 100% online, а скорее сделать небольшую прогу, доступную для скачивания и выкладывать обновления базы (последние в заархивированном виде будут весить совсем копейки). Это и пользователям было бы удобнее (не надо быть всё время online) и не потребует никаких серверных мощностей. Цитата: Мне кажется, и не тоьлко мне, что оптимально использовать статистику слова за неделю. сразу будут видны всплески и падения таких слов в запросах. Словосочетания добавлю. А вот здесь позволю не согласиться. Статистика за неделю может чисто статистически быть нерепрезентативной, особенно по словосочетаниям. Кроме того, часто наоборот будет полезнее иметь "сглаженную" статистику, т.е. что ищется более-менее постоянно, а не в связи с каким-то наступающим или прошедшим событием, праздником и т.д. В таком случае будет гораздо интереснее иметь статистику за 3 месяца, полгода или даже год (если удастся её собрать)... А статистика за неделю нужна только в том случае, если есть желание уловить пик спроса, а не сделать стабильно продающуюся фотографию. Цитата: А зачем делить на общее количество запросов, ведь количество упоминаний данного запроса за период имеет тот же смысл, чем больше упоминаний, тем выше рейтинг. Ведь во всех случаях будет формироваться топ за промежуток времени, деление ничего не даст. Какая разница, если вам выдаст что слово girl(например) упоминалось за неделю 235 раз, а запросов было 10 345? или вам выдаст рейтинг слова girl 0,0227??? Делить на количество запросов имеет смысл для того, чтобы можно было сравнивать рейтинг по запросам за разные промежутки времени. Чтобы не получалось, что рейтинг за месяц в четыре раза выше рейтинга за неделю только потому, что период выборки в четыре раза длиннее. А сравнивать интересно было бы, прежде всего, чтобы понять тенденции спроса (например относя рейтинг определённых слов за последний месяц к их рейтингу за последние 3 месяца, можно определить, например, растёт ли в данный момент спрос на рождественскую тематику или падает). Ещё раз подчёркиваю, что статистика за неделю мне кажется нерепрезентативной ни для чего кроме как улавливания каких-то кратковременных колебаний (что тоже, безусловно, интересно, не далеко не единственное возможное применение данной ст-ки). Цитата: Кроме этого, дримс выдает не все слова, а только либо первые либо последние за прошедшие 10 мин. Еще заметил, что ночью он пару раз обновлял статистику раз в 15 и раз в 20 минут... вроде... Против этого можно сделать элементарную защиту - если считанные вновь данные совпадают с предыдущими, то мы их игнорируем и не сохраняем. Можно, так же, сделать и более гибкую проверку - сравнивать не весь результат, а искать, скажем, 3 или 4 идущих подряд одинаковых запроса - это на случай, если за период обновления данных было слишком мало новых запросов и список обновился частично, что впрочем очень маловероятно... Кроме того, при сборе данной статистики, мне кажется, не стоит особо париться, если какие-то запросы будут пропущены - гораздо "опаснее" если данные будут дублироваться. Поэтому, может, имеет смысл сделать более редкие запросы и добавить проверку на дубликат (как описано выше) - в этом случае мы за неделю или любой другой период накопим меньше данных, но со временем статистика всё равно обретёт репрезентативность. В любом случае - предлагаю не зацикливаться на каком-то одном применении данных - мне кажется гораздо полезнее собрать массив данных, к-е можно будет потом анализировать и так и сяк... |
Автор: | iNNOCENt [ 14 11 2007, 11:20 ] |
Заголовок сообщения: | |
WildCat писал(а): shalex84 писал(а): пока могу сказать, что основные хиты: gerl, boy, men, sexy и с ними связаное.... вот именно поэтому надо привязывать статистику к топу продаж хоть каким-то боком, иначе в результате получится список ключевых слов, наиболее популярных среди... малолетних дрочеров, шарящихся по дриму в поисках ню-шек (и разумеется нифига не покупающих) ![]() А вот этим и отличается идея поиска слов "смежных" с основными словами указанными пользователем от обычных TOP-ов. Если вы не будете указывать основных слов соответствующей тематики, то скорее всего и в результатах они не будут преобладать (и уж практически точно не будут на топовых позициях по упоминаимости в словосочетаниях). Учитывать продажи - было бы хорошо, но боюсь что ни один фотобанк не отдаёт статистики по связке поиск - покупка. Кроме того, статистика продаж может сыграть и дурную шутку - если по большинству запросов были совершены покупки, значит что в фотобанке уже и так навалом хороших работ по данной тематике и не факт, что с ними будет легко конкурировать. А вот если после поиска покупки не было - кроме "дрочеров" и самих фотографов это ещё часто может говорить о том, что потенциальных покупатель просто не нашёл достойного изображения и пошёл искать elsewhere... Цитата: интересно не просто запросы, а связка запрос-покупка, т.е. результативные запросы или же, наоборот, запросы абсолютно нерезультативные, т.е. повторяющиеся запросы того, чего в базе пока мало или нет вообще. кста, кол-во фоток на каждый кейворд вроде как тоже можно вытащить на каком-то из стоков (фотолия? дрим?), точно помню что видел эти цифры в момент ввода слов в поле поиска в виде выпадающей подсказки. это тоже крайне важная инфа, и если ее вытащить и скрестить результаты с частотным словарем английского языка, то - уверен - нас ждут очень интересные результаты ![]() Это - да. Но изначально моя идея была в анализе спроса, а Вы уже говорите о сопоставлении спроса с предложением и анализом конкуренции, что уже следующий, гораздо более сложный этап. Давайте начнём с задачи-минимум ![]() Цитата: понятное дело, сочетания слов в запросе тоже актуально. Мне лично кажется, что именно анализ словосочетаний - есть наиболее интересная часть данного проекта. Ибо по одному слову на любом стоке обычно вываливаются тысячи, если не десятки тысяч соответствий, но при увеличении количества слов в запросе, количество результатов уменьшается в геометрической прогрессии. Если мы сможем чаще попадать в результаты запросов по 3-4 словам - мне кажется это может существенно повысить продаваемость фото. Цитата: в общем, для первого проекта задачка весьма серьезная, но при этом чертовски интересная и весьма перспективная - эдакий реалтайм-анализатор тенденций на рынке с возможностью предсказания
![]() Главное, ИМХО, грамотно собрать информацию исходную (не затачивая её под конкретные нужды), а уж потом её можно будет резать и кроить как угодно. ![]() Да, кстати, мне кажется даже наличие таких слов как girl, young, sexy, и т.д. в топах не является обязательно указанием на то, что их искали просто ради забавы. В наше время в сети столько гораздо более "легко доступных" ресурсов эротики и порно, причём совершенно бесплатных, что нет никакого резона лезть на фотостоки в поисках подобных фото и удовлетворяться на превьюшки. Разве что сами фотографы или покупатели, время от времени, хотят немного отвлечься от работы и немного поглазеть на "прекрасное". Но часто все же, ИМХО, по этим словам действительно ищатся изображения симпатичных и сексуальных для размещения их во всяких буклетах, каталогах и т.д. - ведь не секрет, что сексуальность - один из самых сильных рычагов притяжения внимания к рекламе, на которую порой иначе даже и не взглянешь ![]() |
Автор: | lahtak [ 14 11 2007, 14:18 ] |
Заголовок сообщения: | |
Полностью согласен с предыдущим оратором. Запустил загрузку базы. К сожалению страничка на Дримсе обновляется раз в 15 минут. По поводу хостинга для скрипта - а что нельзя со своего компа запустить? Мой комп выключается только для апгрейда , инет безлимитный |
Автор: | iNNOCENt [ 14 11 2007, 14:27 ] |
Заголовок сообщения: | |
lahtak писал(а): Полностью согласен с предыдущим оратором. Запустил загрузку базы. К сожалению страничка на Дримсе обновляется раз в 15 минут.
По поводу хостинга для скрипта - а что нельзя со своего компа запустить? Мой комп выключается только для апгрейда , инет безлимитный Хм, интересно. А с народом будете делиться или только для себя? ![]() Вы только сбор данных реализовали или и обработку какую-нить? |
Автор: | lahtak [ 14 11 2007, 15:23 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): lahtak писал(а): Полностью согласен с предыдущим оратором. Запустил загрузку базы. К сожалению страничка на Дримсе обновляется раз в 15 минут. По поводу хостинга для скрипта - а что нельзя со своего компа запустить? Мой комп выключается только для апгрейда , инет безлимитный Хм, интересно. А с народом будете делиться или только для себя? ![]() Вы только сбор данных реализовали или и обработку какую-нить? Да мне не жалко , только в каком виде выдавать ? Обработки еще нет. Думаю. Мысль такая - взять из топов слова и на их основе построить гнезда. Для полного счастья хотелось бы и счетчик для каждого слова в гнезде. Но пока не придумал структуру такой базы. И еще вопрос где эти гнездовые слова брать ? У фотолии есть 150 тагов , но они там скрестили ужа с ежом, смешали запросы и описания . Можно и из Шаттера брать, в общем предлагайте ... |
Автор: | shalex84 [ 14 11 2007, 15:29 ] |
Заголовок сообщения: | |
lahtak писал(а): Полностью согласен с предыдущим оратором. Запустил загрузку базы. К сожалению страничка на Дримсе обновляется раз в 15 минут.
По поводу хостинга для скрипта - а что нельзя со своего компа запустить? Мой комп выключается только для апгрейда , инет безлимитный а у меня лимитный, причем быстрый, и жутко дорогой... (первые 500 мб 16$ потом каждие 100 по 2$) PS я так понял я не один пытаюсь чета написать? если так, то хорошо... конкуренция всегда хорошо ![]() |
Автор: | shalex84 [ 14 11 2007, 15:44 ] |
Заголовок сообщения: | |
а что если попробовать брать слова с дримса, потом брать слова из последних скачаных картинок с него же, потом сравнивать слова, и оставлять только те, которые упоминаются в обоих местах? |
Автор: | iNNOCENt [ 14 11 2007, 15:48 ] |
Заголовок сообщения: | |
lahtak писал(а): Да мне не жалко , только в каком виде выдавать ? Обработки еще нет. Думаю. Мысль такая - взять из топов слова и на их основе построить гнезда. Для полного счастья хотелось бы и счетчик для каждого слова в гнезде. Но пока не придумал структуру такой базы. И еще вопрос где эти гнездовые слова брать ? У фотолии есть 150 тагов , но они там скрестили ужа с ежом, смешали запросы и описания . Можно и из Шаттера брать, в общем предлагайте ...
Выдавать предлагаю ввиде небольшой утилитки по работе с базой и периодически (напр.раз в неделю) выкладываемые обновления базы. А что вы называете гнёздами? |
Автор: | lahtak [ 14 11 2007, 15:52 ] |
Заголовок сообщения: | |
shalex84 писал(а): lahtak писал(а): Полностью согласен с предыдущим оратором. Запустил загрузку базы. К сожалению страничка на Дримсе обновляется раз в 15 минут. По поводу хостинга для скрипта - а что нельзя со своего компа запустить? Мой комп выключается только для апгрейда , инет безлимитный а у меня лимитный, причем быстрый, и жутко дорогой... (первые 500 мб 16$ потом каждие 100 по 2$) PS я так понял я не один пытаюсь чета написать? если так, то хорошо... конкуренция всегда хорошо ![]() Да хреново в городе Новополоцке ![]() Да что там писать , накопление базы с датами полчаса работы , труднее всего себя заставить ![]() |
Автор: | iNNOCENt [ 14 11 2007, 16:00 ] |
Заголовок сообщения: | |
shalex84 писал(а): а что если попробовать брать слова с дримса, потом брать слова из последних скачаных картинок с него же, потом сравнивать слова, и оставлять только те, которые упоминаются в обоих местах?
Лично мне кажется, что всё же не стоит лимитировать статистику только тем, что искали и нашли и отбрасывать то, что искали, но не нашли подходящего... Кроме того, уверен, что очень многие при поиске сначала отбирают несколько более-менее подходящих фотографий, а потом из них уже выбирают лучшие (возможно и с разных фотобанков). Иными словами, скачивание происходит (если вообще происходит) не сразу после запроса, а через какой-то промежуток времени. Поэтому считаю, что лучше всё же мониторить просто спрос, а не спрос сиюминутно удовлетворённый конкретным фотобанком (вряд ли это частый случай...). Да и потом, в конце концов какая разница какие слова были в скачанном изображении? Может в нём всего было несколько самых общих слов и оно просто удачно "подвернулось" в поиске. Или наоборот просто картинка очень хорошая и его выудили из дебрей глубоких страниц результатов поиска. Мне кажется, применяя такую логику мы не повышаем шансы подобрать наиболее востребованные ключевые слова, а наоборот даже понижаем. Ведь, в конце концов, наша задача - заставить своё фото "проявиться" в как можно больших результатах поиска по теме и как можно ближе к началу, а уж потом это дело самого фото (его качества, сюжета и т.д.) продать себя... |
Автор: | lahtak [ 14 11 2007, 16:11 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): lahtak писал(а): Да мне не жалко , только в каком виде выдавать ? Обработки еще нет. Думаю. Мысль такая - взять из топов слова и на их основе построить гнезда. Для полного счастья хотелось бы и счетчик для каждого слова в гнезде. Но пока не придумал структуру такой базы. И еще вопрос где эти гнездовые слова брать ? У фотолии есть 150 тагов , но они там скрестили ужа с ежом, смешали запросы и описания . Можно и из Шаттера брать, в общем предлагайте ... Выдавать предлагаю ввиде небольшой утилитки по работе с базой и периодически (напр.раз в неделю) выкладываемые обновления базы. А что вы называете гнёздами? А в каком формате база ? Можно , конечно, выдавать в тексте и а потом например в Эксель пихать. В принципе , можно раздать каждому такую утилитку , которая в конце каждого дня все результаты скидывала бы в файл . Или я могу куда-нить скидывать файлики. А гнездо - топовое слово( woman, girl , business etc ) и к нему все слова , которые встречаются в сочетании с этим словом , хорошо бы с частотой . |
Автор: | shalex84 [ 14 11 2007, 16:18 ] |
Заголовок сообщения: | |
Цитата: А насчёт размера базы - то тут можно посчитать. Если получится дату сохранять один раз на "сеанс" считывания данных с Dreams (а не для каждого отдельного словосочетания), то 1kb ИМХО будет выши крыши на один "сеанс", что при интервале считывания данных раз в 10 минут нам даёт 144 kb в день или порядка 50MB в год, что мне не представляется ужасным... не все так просто, даже если сохранять дату сеанса отдельно, то это будет отдельная колонка с кучей дат, а к словам, как ни крути, придется подписывать порядковые номера этих дат, но это не смертельно. Цитата: Кстати, мне кажется было бы полезным не делать сервис 100% online, а скорее сделать небольшую прогу, доступную для скачивания и выкладывать обновления базы (последние в заархивированном виде будут весить совсем копейки). Это и пользователям было бы удобнее (не надо быть всё время online) и не потребует никаких серверных мощностей. можно, но лично я не знаю как это сделать, точнее как сделать, что бы выкладывать каждый раз не всю базу, а тока новое. Сервер и так используется и ему платят за хостинг, так что без разницы, скока "серверных мощьностей" будет исользоваться, этот параметр не лимитируется. Цитата: А статистика за неделю нужна только в том случае, если есть желание уловить пик спроса, а не сделать стабильно продающуюся фотографию. изначально это было основной задачей ![]() Цитата: В любом случае - предлагаю не зацикливаться на каком-то одном применении данных - мне кажется гораздо полезнее собрать массив данных, к-е можно будет потом анализировать и так и сяк... чтобы потом не парится, надо в самом началепонять чего нам надо и разработать наиболее гибкую базу, причем так, что бы туда не попадали "лишнии" данные, хотя избыток информации лучше нехватки.Цитата: Кроме того, статистика продаж может сыграть и дурную шутку - если по большинству запросов были совершены покупки, значит что в фотобанке уже и так навалом хороших работ по данной тематике и не факт, что с ними будет легко конкурировать. А вот если после поиска покупки не было - кроме "дрочеров" и самих фотографов это ещё часто может говорить о том, что потенциальных покупатель просто не нашёл достойного изображения и пошёл искать elsewhere...
тогда надо просто при совпадении слов из картинки и поиск-ых запросов этим словам накидывать рейтинг,(причем отдельный по покупкам) про словосочетания: у вас желание видеть именно с какими словами употреьлялось данное слово(конкретные словосочетания) или достаточно сделать просто список слов за период времени? и еще идейка, может из вывода результатов убирать топ-100 шатра(по желанию естественно), как мне кажется слова из топ-100 есть почти во всех картинках, и находятся картинки среди всего многообразия по другим словам, по более четким хар-кам? |
Автор: | shalex84 [ 14 11 2007, 16:22 ] |
Заголовок сообщения: | |
lahtak писал(а): Да что там писать , накопление базы с датами полчаса работы , труднее всего себя заставить
![]() на С++ я это так и сделал бы, причем было бы все равно, что и как, но с пхп не общался раньше, поэтому большую часть времени провожу за чтением, ведь везде есть свои особенности а про и-нет, В нашей процветающей стране только в Минске есть конкуренция, а у нас, к примеру, 2мбит/с анлим стоит 500$, как говорится пользуйтесь на здоровье ![]() |
Автор: | lahtak [ 14 11 2007, 16:26 ] |
Заголовок сообщения: | |
WildCat писал(а): shalex84 писал(а): пока могу сказать, что основные хиты: gerl, boy, men, sexy и с ними связаное.... вот именно поэтому надо привязывать статистику к топу продаж хоть каким-то боком, иначе в результате получится список ключевых слов, наиболее популярных среди... малолетних дрочеров, шарящихся по дриму в поисках ню-шек (и разумеется нифига не покупающих) ![]() интересно не просто запросы, а связка запрос-покупка, т.е. результативные запросы или же, наоборот, запросы абсолютно нерезультативные, т.е. повторяющиеся запросы того, чего в базе пока мало или нет вообще. кста, кол-во фоток на каждый кейворд вроде как тоже можно вытащить на каком-то из стоков (фотолия? дрим?), точно помню что видел эти цифры в момент ввода слов в поле поиска в виде выпадающей подсказки. это тоже крайне важная инфа, и если ее вытащить и скрестить результаты с частотным словарем английского языка, то - уверен - нас ждут очень интересные результаты ![]() понятное дело, сочетания слов в запросе тоже актуально. в общем, для первого проекта задачка весьма серьезная, но при этом чертовски интересная и весьма перспективная - эдакий реалтайм-анализатор тенденций на рынке с возможностью предсказания ![]() Проще всего анализировать недельный топ на Шаттере и выцеплять слова из находящихся там картинок. Тем более , у меня такая прога есть , я по ней ключевые к своим картинкам подбираю . Но там одна проблема, разные результаты для вектора и фото. |
Автор: | Юрий Христич [ 14 11 2007, 17:01 ] |
Заголовок сообщения: | |
lahtak писал(а): Но там одна проблема, разные результаты для вектора и фото.
Какая же это проблема? Наоборот -- это очень полезно. Я вообще не понимаю, зачем стоки по умолчанию сваливают вектора и фотографии вперемешку. Мне трудно представить себе покупателя, которому все равно, что он найдет: вектор или фото. |
Автор: | iNNOCENt [ 14 11 2007, 17:03 ] |
Заголовок сообщения: | |
Цитата: А в каком формате база ? Можно , конечно, выдавать в тексте и а потом например в Эксель пихать. В принципе , можно раздать каждому такую утилитку , которая в конце каждого дня все результаты скидывала бы в файл . Или я могу куда-нить скидывать файлики. Можно в тексте (только тогда уж в CSV), но только не в Excel, ибо там лимит 64 тыс строк, что будет мало для запросов за более-менее длительный промежуток времени. Можно либо в Access либо в формате любой легко-доступной базы данных вроде SQLite (хотя я не знаю какие ограничения последней)... А гнездо - топовое слово( woman, girl , business etc ) и к нему все слова , которые встречаются в сочетании с этим словом , хорошо бы с частотой .[/quote] В моей первоначальной идее такие "гнезда" каждый раз задаёт сам пользователь, в зависимости от фото, к-ю ему в данный момент нужно описать. То есть если у меня есть фото с пляжем и пальмой, я задаю (из головы) слова beach, summer, palm и запускаю поиск и в результате получаю список употреблявшихся в запросах слов вместе с указанными мной. Мне не нравится идея привязки к каким-либо стандартным категориям или топам, потому что всё-таки стоит задача как можно более точно описать своё конкретное фото, при этом сделав это наиболее популярными (но при этом соответствующим содержанию фото!) словами. |
Автор: | iNNOCENt [ 14 11 2007, 17:14 ] |
Заголовок сообщения: | |
lahtak писал(а): WildCat писал(а): shalex84 писал(а): пока могу сказать, что основные хиты: gerl, boy, men, sexy и с ними связаное.... вот именно поэтому надо привязывать статистику к топу продаж хоть каким-то боком, иначе в результате получится список ключевых слов, наиболее популярных среди... малолетних дрочеров, шарящихся по дриму в поисках ню-шек (и разумеется нифига не покупающих) ![]() интересно не просто запросы, а связка запрос-покупка, т.е. результативные запросы или же, наоборот, запросы абсолютно нерезультативные, т.е. повторяющиеся запросы того, чего в базе пока мало или нет вообще. кста, кол-во фоток на каждый кейворд вроде как тоже можно вытащить на каком-то из стоков (фотолия? дрим?), точно помню что видел эти цифры в момент ввода слов в поле поиска в виде выпадающей подсказки. это тоже крайне важная инфа, и если ее вытащить и скрестить результаты с частотным словарем английского языка, то - уверен - нас ждут очень интересные результаты ![]() понятное дело, сочетания слов в запросе тоже актуально. в общем, для первого проекта задачка весьма серьезная, но при этом чертовски интересная и весьма перспективная - эдакий реалтайм-анализатор тенденций на рынке с возможностью предсказания ![]() Проще всего анализировать недельный топ на Шаттере и выцеплять слова из находящихся там картинок. Тем более , у меня такая прога есть , я по ней ключевые к своим картинкам подбираю . Но там одна проблема, разные результаты для вектора и фото. Блин, ну не понимаю я, что вы всё привязываетесь к топам всяким? Мне кажется и дураку понятно (ну или хотя бы человеку пару месяцев покрутившемуся на стоках), что самые общие слова вроде girl, backgroung и т.д. будут вечно болтаться в топах, а в топах за неделю будут всякие Christmas, Haloween, и т.д. Только - толку-то от этого! По любому из этих слов найдутся тысячи соответствий и добавление этих слов к своим работам не принесёт им популярности. Идея-то заключалась в том, чтобы каждый для своих конкретных работ подбирал популярные, но обязательно подходящие слова, причём желательно ещё и все "смежные" (но при этом тоже описывающих конкретное фото) слова из запросов. А из топов на каждую фотку найдется от силы 3-5 самых общих слов... В моём понимании, нужно забыть про имеющиеся топы и сделать в альтернативу им гораздо более гибкий и точный алгоритм подбора популярных слов и словосочетаний. |
Автор: | shalex84 [ 14 11 2007, 17:42 ] |
Заголовок сообщения: | |
тише, тише, не привязываюсь я пока к топам, просто предложил сохранять как доп. параметр, который потом в обработке можно было бы и не использовать. избыток лучше нехватки... |
Автор: | iNNOCENt [ 14 11 2007, 17:48 ] |
Заголовок сообщения: | |
Ещё раз попытаюсь объяснить мою идею. 1) Допустим, мне надо для фото "пляжа с пальмой" выбрать 5 ключевых слов (5 - чтобы много тут не писать). 2) Я ввожу основные слова по данному фото: palm, beach. Нажимаю поиск. 3) В результате получаю десять слов (10 - опять-таки для краткости), которые наиболее часто используются в запросах либо со словом palm, либо со словом beach, отсортированные в порядке их популярности (причём либо по абсолютной популярности слова, либо по популярнорности слова в словосочетании с моими palm и beach): sand, boat, girl, sea, summer, vacation, holiday, blue, hot, sandy 4) Далее, я уже используя свою эрудицию, двигаюсь по списку сверху вниз и отбираю 5 ключевых слов для своего фото: palm, beach (эти два понятно, ибо это основные слова для моего фото), sand, sea, summer. При этом, я отбросил слова boat и girl, потому что ни лодок ни девочек у меня на фото нет. В итоге, я отобрал 3 подходящие для фото слова, наиболее часто используемых в запросах вместе с моими основными palm и beach. Не имея данной статистики, я бы, возможно, предпочёл вместо sand & sea использовать слова vacation & holiday, тем самым понизив шансы своего фото, ибо эти слова менее популярны... И всё. Никаких топов не нужно ИМХО притягивать. Мне кажется - всё достаточно просто. Умел бы программировать - давно бы уже сам такое сделал... А все топы, ИМХО - ерунда, достаточно один раз туда глянуть, но они никак не помогают описать конкретные фотографии. P.S. На таком простом примере из 5 слов, возможно все слова и получатся из TOP-100, но это лишь потому что я выбрал совсем простые слова для простоты объяснения. А когда нужно подобрать up to 50 ключевых слов, то ни из каких топов их не наберешь. P.P.S. Существующий сервис (microstock.ru), конечно же по-своему хорош, но он не сортирует слова по популярности поиска по ним. Конечно же, продаваемость фото о многом говорит, но ключевые слова у них зачастую подобраны весьма безобразным образом (т.е. ИМХО при лучшем подборе ключевых слов, они бы могли продаваться ещё лучше...) |
Автор: | iNNOCENt [ 14 11 2007, 18:03 ] |
Заголовок сообщения: | |
shalex84 писал(а): тише, тише, не привязываюсь я пока к топам, просто предложил сохранять как доп. параметр, который потом в обработке можно было бы и не использовать. избыток лучше нехватки...
Сорри, немного переборщил. Просто я изначально хотел уйти от использования существующих топов, поскольку они мне кажутся не особо полезными в повседневной жизни. Разве что только новичку, интересующемуся "а что же вообще ищут на этих стоках". Может это и я чего-то не понимаю, не улавливаю в чём прелесть возможности привязки к существующим топам... |
Автор: | shalex84 [ 14 11 2007, 18:18 ] |
Заголовок сообщения: | |
как не крути, у нас будет получаться свой топ, который будет совпадать с топами банков... полюбому выплывут слова "герл", "бьюти" и тд я новичек в стоках, поэтому могу и "подтормаживать", но читал здесь, что иногда дизайнерам и иже с ними попадаются просто красивые фото и они их скачивают не потому, что им надо они сейчас, а потому, что их можно будет использовать позже и есть задумки... и , как мне кажется, добавить пару слов из топов банков, будет возможность попасть на таких дизайнеров. Это пока домыслы, оценить обстановку можно будет когда сервис заработает на полную.... |
Автор: | Юрий Христич [ 14 11 2007, 18:30 ] |
Заголовок сообщения: | |
shalex84 писал(а): иногда дизайнерам и иже с ними попадаются просто красивые фото и они их скачивают не потому, что им надо они сейчас, а потому, что их можно будет использовать позже и есть задумки
Для Шаттера возможно. И даже очень вероятно. Для розничных покупателей -- вряд ли. Проще сохранить ссылку или скачать превьюшку. А правильнее завести себе лайтбокс, куда и складывать ценные находки. "Про запас" на розничных стоках дизайнеры наверняка закупаются, только перед повышением цен. Я по своему опыту (и как покупатель и как продавец), замечал, что часто сначала скачивают изображение в маленьком размере, а потом, через какое-то непродолжительное время (от нескольких часов до нескольких суток) берут его в большом размере или в векторе. Впрочем, наверное это лучше обсудить не здесь, а в ветке "Взгляд со стороны покупателя". |
Автор: | WildCat [ 14 11 2007, 18:59 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): Может это и я чего-то не понимаю, не улавливаю в чём прелесть возможности привязки к существующим топам...
попробую пояснить... есть две отдельные задачи: 1. Присвоение к УЖЕ снятой картинке наиболее правильных в смысле продаваемости ключевых слов. 2. Инструмент, позволяющий на основе собранной статистики предположить, что и когда надо снимать и выкладывать, что б попасть "в струю". Первая задача, действительно, к топам имеет весьма отдаленное отношение. Картинка уже есть, и нам требуется только описать ее наиболее оптимальным образом. Сервис на microstock.ru в данном случае очень удобен, а если к нему будет добавлен механизм подбора слов по популярным сочетаниям ключей на основе постоянно собираемой статистики дрима, это будет мегаинструмент. Повод поговорить с shad-ом по поводу сотрудничества. А вот вторая задача... Тут как раз топы и поисковые запросы очень и очень интересны именно в динамике, т.е. с привязкой по датам. Интересны даже не столько абсолютные цифры, сколько их производные, внезапные всплески активности к тем или иным словам. Простой пример - если слово "снежинка" в какой-то момент начинает встречаться в десяти картинках из топа, эти картинки довольно быстро перебираются все выше и выше, а до этого снежинок в топах и в помине не было - это повод задуматься. Однако когда снежинки УЖЕ в топе, снимать такое поздно, посему важно понять когда именно начинается интерес к снежинкам ![]() Задача на год, ессно, только через такой срок имеет смысл говорить о практической пользе, но базу надо начинать набивать уже "вчера". еще один момент по поводу второй задачи. собранную статистику по словам желательно пропускать через некий "упрощатель" - словарь синонимов, который все синонимы заменит на базовое слово (например girl и female превратятся в woman). Во второй задаче мы работаем с производными, ищем направления, поэтому чем меньше у нас будет исходных ключей, тем точнее будет анализ. |
Автор: | lahtak [ 14 11 2007, 19:17 ] |
Заголовок сообщения: | |
WildCat писал(а): iNNOCENt писал(а): Может это и я чего-то не понимаю, не улавливаю в чём прелесть возможности привязки к существующим топам... попробую пояснить... есть две отдельные задачи: 1. Присвоение к УЖЕ снятой картинке наиболее правильных в смысле продаваемости ключевых слов. 2. Инструмент, позволяющий на основе собранной статистики предположить, что и когда надо снимать и выкладывать, что б попасть "в струю". Первая задача, действительно, к топам имеет весьма отдаленное отношение. Картинка уже есть, и нам требуется только описать ее наиболее оптимальным образом. Сервис на microstock.ru в данном случае очень удобен, а если к нему будет добавлен механизм подбора слов по популярным сочетаниям ключей на основе постоянно собираемой статистики дрима, это будет мегаинструмент. Повод поговорить с shad-ом по поводу сотрудничества. А вот вторая задача... Тут как раз топы и поисковые запросы очень и очень интересны именно в динамике, т.е. с привязкой по датам. Интересны даже не столько абсолютные цифры, сколько их производные, внезапные всплески активности к тем или иным словам. Простой пример - если слово "снежинка" в какой-то момент начинает встречаться в десяти картинках из топа, эти картинки довольно быстро перебираются все выше и выше, а до этого снежинок в топах и в помине не было - это повод задуматься. Однако когда снежинки УЖЕ в топе, снимать такое поздно, посему важно понять когда именно начинается интерес к снежинкам ![]() Задача на год, ессно, только через такой срок имеет смысл говорить о практической пользе, но базу надо начинать набивать уже "вчера". еще один момент по поводу второй задачи. собранную статистику по словам желательно пропускать через некий "упрощатель" - словарь синонимов, который все синонимы заменит на базовое слово (например girl и female превратятся в woman). Во второй задаче мы работаем с производными, ищем направления, поэтому чем меньше у нас будет исходных ключей, тем точнее будет анализ. C Упрощателем надо поосторожнее , смотрю в базу - animal male teen нехорошо может получиться . Но мне уже сейчас ясно , только днем сегодня прогу запустил , что запросы позволяют более точно определять требуемые сюжеты. А вообще одни хотят одно , другие иное. Могу дать материал и крутите как хотите. Для меня главное что бы мои ключевые слова как можно ближе подходили к запросам клиентов . В этом направлении и буду работать. |
Автор: | Slonov [ 15 11 2007, 09:17 ] |
Заголовок сообщения: | |
lahtak писал(а): А вообще одни хотят одно , другие иное. Могу дать материал и крутите как хотите. Для меня главное что бы мои ключевые слова как можно ближе подходили к запросам клиентов . В этом направлении и буду работать.
А в каком виде сейчас? Если программа кидает все в текстовый файл - то мне бы очень пригодилось бы. ![]() |
Автор: | lahtak [ 15 11 2007, 14:14 ] |
Заголовок сообщения: | |
Slonov писал(а): lahtak писал(а): А вообще одни хотят одно , другие иное. Могу дать материал и крутите как хотите. Для меня главное что бы мои ключевые слова как можно ближе подходили к запросам клиентов . В этом направлении и буду работать. А в каком виде сейчас? Если программа кидает все в текстовый файл - то мне бы очень пригодилось бы. ![]() Это можно , только формат надо согласовать с датами или без ? За сутки набило около 2000 позиций. Интересное наблюдение . Надо, например, найти человека с телефоном . Нормальный человек напишет - man phone . А наши клиенты очень часто пишут - man phone with . Имейте ввиду |
Автор: | Slonov [ 15 11 2007, 15:46 ] |
Заголовок сообщения: | |
lahtak писал(а): Это можно , только формат надо согласовать с датами или без ?
За сутки набило около 2000 позиций. Интересное наблюдение . Надо, например, найти человека с телефоном . Нормальный человек напишет - man phone . А наши клиенты очень часто пишут - man phone with . Имейте ввиду Мне, например, с датами не надо. Когда грузить к празднику или сезону и так понятно. Если захочется отследить что-то во времени (что вряд-ли) - можно и относительными значениями обойтись какими-нибудь. Если просто будет подгружать в текстовый файл словосочетания с каким-нибудь разделителем - будет отличная штука |
Автор: | iNNOCENt [ 15 11 2007, 16:37 ] |
Заголовок сообщения: | |
Slonov писал(а): lahtak писал(а): Это можно , только формат надо согласовать с датами или без ? За сутки набило около 2000 позиций. Интересное наблюдение . Надо, например, найти человека с телефоном . Нормальный человек напишет - man phone . А наши клиенты очень часто пишут - man phone with . Имейте ввиду Мне, например, с датами не надо. Когда грузить к празднику или сезону и так понятно. Если захочется отследить что-то во времени (что вряд-ли) - можно и относительными значениями обойтись какими-нибудь. Если просто будет подгружать в текстовый файл словосочетания с каким-нибудь разделителем - будет отличная штука А я бы, всё-таки, предпочёл с датами. Ну и какой-нить обработчик всё же тоже хотелось бы... Конечно могу попробовать сам поковырять в Access'e, но боюсь я всё же не настолько в этом силён... Хотя, для начала и просто базу интересно было бы поиметь... |
Автор: | lahtak [ 15 11 2007, 19:04 ] |
Заголовок сообщения: | |
Сегодня поменял формат базы и запустил заново. Завтра сделаю утилитку без базы , просто по запросу будет сбрасывать в текст. Настройки - с датой , без даты. Не помню точно , но текст импортируется в базу достаточно просто. |
Автор: | shalex84 [ 15 11 2007, 20:20 ] |
Заголовок сообщения: | |
у меня база mySQL, но текстовый txt сделать это вообще не проблема, чтобы перегнать бызу надо 5-10 строк текста.... |
Автор: | lahtak [ 16 11 2007, 16:14 ] |
Заголовок сообщения: | |
Ну сделал я эту утилитку . Пишет в текстовый файл с датами и без дат. Кому надо - делайте заявки , пришлю. |
Автор: | WildCat [ 16 11 2007, 16:41 ] |
Заголовок сообщения: | |
lahtak писал(а): Ну сделал я эту утилитку . Пишет в текстовый файл с датами и без дат.
Кому надо - делайте заявки , пришлю. ура! надо! wildcat78 на gmail тчк com |
Автор: | lahtak [ 16 11 2007, 16:43 ] |
Заголовок сообщения: | |
WildCat писал(а): lahtak писал(а): Ну сделал я эту утилитку . Пишет в текстовый файл с датами и без дат. Кому надо - делайте заявки , пришлю. ура! надо! wildcat78 на gmail тчк com Через gmail экзешник не пройдет ![]() |
Автор: | katritch [ 16 11 2007, 17:38 ] |
Заголовок сообщения: | |
помогите разобраться новичку с логикой ключевых слов и поиска на шаттере! например, если икать слова "seamless snowflakes", то мои снежинки стоят пятые по популярности, а если "seamless snow" - то в самом конце среди самых беспантовых. почему это происходит, и что надо сделать, чтобы картинки лучше котировались? это зависит от названия? ключевых слов у меня 50.. и вообще по слову snow у картинка не ищется, хотя в ключевых оно есть. |
Автор: | Slonov [ 16 11 2007, 21:22 ] |
Заголовок сообщения: | |
lahtak писал(а): Ну сделал я эту утилитку . Пишет в текстовый файл с датами и без дат.
Кому надо - делайте заявки , пришлю. Делаю заявку. tov_slonov(собака)mail.ru Если не проходит (не знаю, может на всех бесплатных так), то slonov(пес)viliga.spb.ru |
Автор: | lahtak [ 16 11 2007, 22:55 ] |
Заголовок сообщения: | |
katritch писал(а): помогите разобраться новичку с логикой ключевых слов и поиска на шаттере!
например, если икать слова "seamless snowflakes", то мои снежинки стоят пятые по популярности, а если "seamless snow" - то в самом конце среди самых беспантовых. почему это происходит, и что надо сделать, чтобы картинки лучше котировались? это зависит от названия? ключевых слов у меня 50.. и вообще по слову snow у картинка не ищется, хотя в ключевых оно есть. По моему , все очевидно , слово snow гораздо более распрстраненное |
Автор: | lahtak [ 16 11 2007, 22:57 ] |
Заголовок сообщения: | |
Вроде всем послал. Христич выразил желание разместить на своем сайте , послал и ему. Тестируйте ![]() |
Автор: | Юрий Христич [ 16 11 2007, 23:09 ] |
Заголовок сообщения: | |
Кому интересно, берите программку отсюда: http://www.dubki.ru/~molinga/zastavkin/SKW_Light.zip |
Автор: | Slonov [ 16 11 2007, 23:20 ] |
Заголовок сообщения: | |
lahtak писал(а): Вроде всем послал. Христич выразил желание разместить на своем сайте , послал и ему. Тестируйте
![]() Спасибо! Запустил уже |
Автор: | lvinst [ 17 11 2007, 23:46 ] |
Заголовок сообщения: | |
Скачала программу. Спасибо, lahtak. Есть только одна непонятка: у меня группы ключевх слов дублируются. То есть похоже стаистика забирается с сайта чаще, чем успевает измениться группа ключевых слов. Либо я делаю что-то не так. Если Вы согласитесь переслать мне исходник, я верну его с доработкой - проверкой на неповторение групп ключевых. |
Автор: | lahtak [ 18 11 2007, 00:01 ] |
Заголовок сообщения: | |
lvinst писал(а): Скачала программу. Спасибо, lahtak. Есть только одна непонятка: у меня группы ключевх слов дублируются. То есть похоже стаистика забирается с сайта чаще, чем успевает измениться группа ключевых слов. Либо я делаю что-то не так.
Если Вы согласитесь переслать мне исходник, я верну его с доработкой - проверкой на неповторение групп ключевых. Считывание происходит раз в 5 минут. Но если давить на СТАРТ то будет двоить. А двоение происходит постоянно ? Изначально у меня была эта проверка , потом я ее выкинул, не помню почему ![]() |
Автор: | lvinst [ 18 11 2007, 00:15 ] |
Заголовок сообщения: | |
lahtak писал(а): А двоение происходит постоянно ?
Да. И не только двоение. Некоторые группы запросов встеречаются даже три раза. Стартую однократно и оставляю прогу в покое. Так то дело не в старте. |
Автор: | lahtak [ 18 11 2007, 01:13 ] |
Заголовок сообщения: | |
lvinst писал(а): lahtak писал(а): А двоение происходит постоянно ? Да. И не только двоение. Некоторые группы запросов встеречаются даже три раза. Стартую однократно и оставляю прогу в покое. Так то дело не в старте. Сейчас я в другом месте нет исходника под рукой , но кажется знаю в чем дело , завтра переправлю. |
Автор: | lahtak [ 18 11 2007, 15:27 ] |
Заголовок сообщения: | |
Послал исправленную версию Христичу. |
Автор: | Юрий Христич [ 18 11 2007, 15:31 ] |
Заголовок сообщения: | |
Заменил старый вариант программы. Адрес для скачивания тот же: http://www.dubki.ru/~molinga/zastavkin/SKW_Light.zip |
Автор: | lvinst [ 18 11 2007, 17:52 ] |
Заголовок сообщения: | |
Спасибо, скачала. Теперь все нормально работает. |
Автор: | lahtak [ 18 11 2007, 20:24 ] |
Заголовок сообщения: | |
Cтатистика потихоньку набирается. Надо думать об анализе. Первое что пришло в голову - топ 2. Топовые слова мы и так все хорошо знаем , а вот что делается во второй сотне покрыто мраком неизвестности. Одновременно отслеживать сезонные слова . Вот очень интересно когда будут требовать пасху, яйца и кроликов. И как все будет выглядеть в динамике. |
Автор: | iNNOCENt [ 19 11 2007, 10:55 ] |
Заголовок сообщения: | |
Спасибо за прогу! Хорошо бы ещё кто-нибудь смог файлы статистики выкладывать куда-нить... А то не у всех есть возможность всё время в сети висеть и самим её собирать... Ну а если у себя на компе запускать - то хотя бы возможность прятать в system tray нужна. |
Автор: | lahtak [ 19 11 2007, 12:48 ] |
Заголовок сообщения: | |
iNNOCENt писал(а): Спасибо за прогу!
Хорошо бы ещё кто-нибудь смог файлы статистики выкладывать куда-нить... А то не у всех есть возможность всё время в сети висеть и самим её собирать... Ну а если у себя на компе запускать - то хотя бы возможность прятать в system tray нужна. Можно скидывать раз в неделю на Рапиду или брать с Осла , он у меня практически всегда включен. Мне отсутсвие трея не мешает , даже наоборот. Но можно сделать. |
Автор: | iNNOCENt [ 19 11 2007, 16:47 ] |
Заголовок сообщения: | |
lahtak писал(а): iNNOCENt писал(а): Спасибо за прогу! Хорошо бы ещё кто-нибудь смог файлы статистики выкладывать куда-нить... А то не у всех есть возможность всё время в сети висеть и самим её собирать... Ну а если у себя на компе запускать - то хотя бы возможность прятать в system tray нужна. Можно скидывать раз в неделю на Рапиду или брать с Осла , он у меня практически всегда включен. Мне отсутсвие трея не мешает , даже наоборот. Но можно сделать. Лично мне было бы удобнее с Рапиды брать - до Осла у меня firewalls злостные не дают достучаться, и мне его не победить... |
Автор: | WildCat [ 19 11 2007, 19:56 ] |
Заголовок сообщения: | |
спасибо за программку! тоже потихоньку собираю статистику... пара мыслей, которые появились при просмотре получившегося списка запросов: - множественное число используется реже на порядок, чем единственное; - прилагательные в загоне. как будет более объемная база, попробую прогнать ее через словарь на тему того, какие части речи более употребимы и верны ли мои первые предположения. если они верны, то сервис для подбора ключевых надо модифицировать: во-первых, объединение единственного и множественного чисел - зло, а во-вторых там большую часть списка результатов занимают как раз прилагательные, а по ним похоже никто ничего не ищет... |
Автор: | WildCat [ 19 11 2007, 21:52 ] |
Заголовок сообщения: | |
Zoom писал(а): Ребят, поройтесь в форуме, кажется, кто-то уже выкладывал базу поисковых запросов, и именно на Дримсе.. оклоло года назад.... Дежа Вю у меня
![]() Выкладывал cmapuk, но сейчас эта тема и эта статистика поиском не находится (причем сам cmapuk свои сообщения не удалял). Может я плохо искал, конечно...... В общем, вот эта база: http://www.wildcat.sp.ru/latest.html Данные на начало апреля 2006 года. Статистика собиралась аналогичным образом. |
Автор: | Slonov [ 01 12 2007, 03:29 ] |
Заголовок сообщения: | |
Итак, некоторая статистика по ключевым, собранным на Дримсе с помощью софтинки lahtak'а около 23 тыс. запросов составлено с помощью примерно 11 тыс. слов. Всего использовано около 40 тыс слов. Все - без объединения ед. и мн. числа и пр. Топ, с количеством использования каждого слова, выложен тут: http://rapidshare.com/files/73445263/topdream.rar.html Обратите внимание на достаточно большое разнообразие - тор 100 дает только 20% всех использований слов. Треть всех использований - слова, встречающиеся 1-3 раза. Вообще много интересного. Например, clouds+cloud=15 всего. |
Автор: | Paha_L [ 01 12 2007, 10:10 ] |
Заголовок сообщения: | |
еще оказывается любят предлог with |
Автор: | iChip [ 01 12 2007, 11:25 ] |
Заголовок сообщения: | |
Slonov писал(а): Итак, некоторая статистика по ключевым, собранным на Дримсе с помощью софтинки lahtak'а
. А кроме рапиды нигде нельзя выложить файл? |
Автор: | lahtak [ 01 12 2007, 11:45 ] |
Заголовок сообщения: | |
Paha_L писал(а): еще оказывается любят предлог with
Я это сразу заметил |
Автор: | Slonov [ 01 12 2007, 11:47 ] |
Заголовок сообщения: | |
iChip писал(а): Slonov писал(а): Итак, некоторая статистика по ключевым, собранным на Дримсе с помощью софтинки lahtak'а . А кроме рапиды нигде нельзя выложить файл? Скажите где удобно, выложу. |
Автор: | Юрий Христич [ 02 12 2007, 01:32 ] |
Заголовок сообщения: | |
Выложил опять к себе в ту же помойку (: http://www.dubki.ru/~molinga/zastavkin/topdream.zip |
Автор: | iChip [ 02 12 2007, 02:05 ] |
Заголовок сообщения: | |
Slonov писал(а): iChip писал(а): Slonov писал(а): Итак, некоторая статистика по ключевым, собранным на Дримсе с помощью софтинки lahtak'а . А кроме рапиды нигде нельзя выложить файл? Скажите где удобно, выложу. Не успел ответить, Юрий выложил. У меня Рапидшара просит аплоада файлов вместо скачки, к тому же этот многоступенчатый, как ракета, доступ к файлу.... ![]() |
Автор: | lahtak [ 02 12 2007, 14:32 ] |
Заголовок сообщения: | |
А вот Вам задача для ума или нарочно не придумаешь children mad heacovered footballs strawberry heads tails cartoon girl half women crazed individuality people construction drunk workers |
Страница 1 из 1 | Часовой пояс: UTC + 2 часа [ Летнее время ] |
Powered by phpBB® Forum Software © phpBB Group https://www.phpbb.com/ |