Список форумов Война Война

 
 FAQFAQ   ПоискПоиск   ПользователиПользователи   ГруппыГруппы   РегистрацияРегистрация 
 ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Important Notice: We regret to inform you that our free phpBB forum hosting service will be discontinued by the end of June 30, 2024. If you wish to migrate to our paid hosting service, please contact billing@hostonnet.com.
Методика работы с поисковиками.
На страницу 1, 2  След.
 
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Война -> Интернет и информация
Предыдущая тема :: Следующая тема  
Автор Сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 7:34 pm    Заголовок сообщения: Методика работы с поисковиками. Ответить с цитатой

Эффективный поиск в Google. 24 правила
Среда, августа 22, 2007 at 9:24

http://stmd.ru/archives/60
Цитата:
1. Один из нескольких (логическое ИЛИ). По-умолчанию Google ищет страницы, которые содержат все слова из поискового запроса, но если требуется выдать и те, которые содержат хотя бы одно слово из заданного множества, можно воспользоваться логическим оператором ИЛИ. Ему соответствует символ «|» (по-английски он именуется pipe symbol). Пример: молоко|огурцы|селедка.

2. Кавычки. Если вам необходимо найти определенную фразу дословно, можно использовать кавычки. Пример: «Hotel California» (аналогичный запрос без кавычек вернул бы не только ссылки на все упоминания одноименной песни, но и на множество сайтов тур-операторов и гостиниц).

3. Исключение (логическое НЕ). Для того, чтобы исключить из результата поиска те страницы, которые содержат определенное слово, в поисковом запросе необходимо использовать символ «-». Пример: linux distrib download -suse (запрос вернет ссылки на страницы для скачивания различных дистрибутивов Linux, за исключением Suse).

4. Похожие слова. Для того, чтобы Google искал слова, похожие на заданное, используйте символ «~» (тильда). Будут найдены синонимы и слова с альтернативными окончаниями. Пример: ~hippo (по запросу будет так же найдено, например, слово hyppopotamus).

5. Маски. Символ «*» можно использовать как маску — условное обозначение произвольного количества любых символов. Это может быть полезно, например, если вы пытаетесь найти текст песни, но не можете при этом точно вспомнить слова. Или отыскать сайт, домен которого запомнился только отчасти. Пример: welcome to the hotel * such a lovely place; *pedia.org.

6. Расширенный поиск. Если вы забыли какой-либо из перечисленных операторов, всегда можно воспользоваться формой расширенного поиска.

7. Определения. Используйте оператор define: для быстрого поиска определений. Пример: define:Ктулху (запрос выдаст ссылку на страницу из Википедии).

8. Калькулятор. Одной из полезных и при этом малоизвестных возможностей Google является вычисление арифметических выражений. Во многих случаях это быстрее, чем использование программы калькулятора. В выражениях можно использовать операторы +, — , *, /, ^ (степень), sqrt (квадратный корень), sin, cos, tan, ln, lg, exp (ex), скобки и много чего еще. Пример: sqrt (25 * 25) * 768.

9. Числовые интервалы. В Google существует еще одна малоизвестная возможность — поиск числовых интервалов, которые можно задавать с помощью крайних значений, разделенных последовательностью из двух точек. Пример: Букер 2004...2007.

10. Поиск на заданном сайте. С помощью оператора site: можно ограничить результаты поиска определенным веб-сайтом. Именно эта возможность обычно используется при установке поисковых форм Google на сторонних ресурсах. Пример: seagate barracuda site:ixbt.com.

11. Ссылки извне. С помощью оператора link:, можно найти страницы, которые ссылаются на заданный URL. Оператор можно использовать не только для главного адреса сайта, но и для отдельных страниц. Оператор не дает гарантии, что в результате поиска будут перечислены абсолютно все страницы. Пример: link:paradigm.ru.

12. Вертикальный поиск. Вместо того, чтобы искать заданные слова во всем вебе, можно ограничить поиск какой-либо одной определенной сферой. В Google входит множество поисковых сервисов, позволяющих находить интересующую информацию в блогах, новостях, книгах, и многих других категориях:
* Blog Search
* Book Search
* Scholar
* Catalogs
* Code Search
* Directory
* Finance
* Images
* Local/Maps
* News
* Patent Search
* Product Search
* Video
* Linux resouces search and BSD resouces search

13. Кино. Для поиска названий фильмов удобно использовать оператор movie:. Пример: movie:One Flew Over the Cuckoo's Nest.

14. Музыка. Оператор music: ограничит результаты поиска контентом, который тем или иным образом связан с музыкой. Пример: music:Depeche Mode 101.

15. Преобразователь единиц измерения. Google можно использовать для быстрого преобразования метров в ярды, килограммов в фунты, литров в джоули. Для этого используется абсолютно естественный для человеческого понимания синтаксис. Пример: 16 tons in pounds. Update: по тому же принципу можно выполнять преобразования между суммами в различных валютах. Например: 15 Ruble in USD. Курсы валют Google узнаёт из Citibank N.A.

16. Числовые шаблоны. Алгоритмы Google умеют распознавать тип числовых данных по шаблону их ввода. К сожалению, большинство этих шаблонов соответствуют только американским стандартам. В частности можно искать:
* региональные телефонные коды;
* номера автомобилей (US, как не сложно догадаться, only);
* инвентарные номера Федеральной Комиссии Коммуникаций FCC (так же US only);
* UPC (универсальные товарные коды, применяемые в США);
* регистрационные номера Федерального авиационного агентства (США);
* номера патентов (США);
* биржевые котировки (нужно использовать символы акций) и прогноз погоды на пять дней вперед.

17. Типы файлов. В случае, если вы хотите искать, например, только документы в формате PDF, Word или Excel, можно использовать оператор filetype:. Полный список поддерживаемых форматов на момент написания данного текста: Adobe Reader PDF (.pdf), Adobe Postscript (.ps), Autodesk DWF (.dwf), Google Earth (.kml, .kmz), Microsoft Excel (.xls), Microsoft PowerPoint (.ppt), Microsoft Word (.doc), Rich Text Format (.rtf), Shockwave Flash (.swf). Пример: stroustrup c++ language filetype:pdf. Update: Для выбора типа искомых файлов так же можно использовать оператор ext:.

18. Местоположение слова. По-умолчанию Google ищет заданный текст внутри содержимого страниц. Но если есть необходимость искать в некоей определенной области, можно использовать такие операторы как «inurl:» (поиск внутри URL), «intitle:» (поиск в заголовке страницы), «intext:» (поиск в тексте страницы), и «inanchor:» (поиск в тексте ссылок).

19. Кэшированные страницы. При поиске устаревших страниц и страниц, контент которых был обновлен, может помочь поиск в кэше поисковой машины. Для этого предназначен оператор cached:. Update: Существует так же близкий по смыслу оператор cache:, с помощью которого можно сразу получать страницы из кэша по их URL. Этой возможностью в принципе можно пользоваться как своеобразным бэкапом видимых для Google веб-страниц: даже если страница будет удалена со своего сайта, на Google может остаться ее копия.

20. Ответ на главный вопрос жизни, вселенной и всего такого. Google знает ответ даже на этот сакраментальный вопрос (если он будет записан по-английски в нижнем регистре).

21. Поиск лиц. У поисковика картинок есть интересная (и, на сколько мне известно, пока официально недокументированная) возможность — выделять из всего множества найденных изображений лица. Для того, чтобы этим воспользоваться, необходимо добавить к URL результата поискового запроса дополнительный GET-параметр imgtype=face. Пример: http://.../images?q=Audrey+Tautou&imgtype=face

22. Информация о сайте. С помощью оператора info: можно получить известную Google информацию об указанном сайте. Пример: info:habrahabr.ru.

23. Похожие сайты. С помощью оператора related: Google может выдать список сайтов, которые считает похожим на заданный. Пример: related:flickr.com.

24. Способы представления. Помимо стандартного представления результатов поиска, существуют ещё два экспериментальных, которые можно активировать с помощью оператора view:. Первый из них — timeline предназначен для отображения различных хронологических событий и может наглядно представить распределение результатов поиска на временной оси. Пример: George Washington view:timeline (результатом подобного запроса будет некое подобие биографии, материалы которой собраны с множества ресурсов Сети).

Второй способ отображения — map удобен для поиска по картам. При его выборе, в отчёте с результатами поиска сразу открывается фрейм с картой, на которой указателями помечено то, что нашел Goolge. Пример: fifth avenue ny view:map. С русским (да и любым неанглийским языком), как не сложно догадаться, сервис пока не дружит. Кроме того, релевантность поиска по картам оставляет желать лучшего (хотя бы потому что запрос Saint Petersburg view:map поставил Москву, Павловск и Петродворец выше искомого города с четко заданным названием).
PS
А вот еще отличный способ искать музыку: -inurl:(htm|html|php) intitle:"index of" «last modified» «parent directory» description size (wma|mp3) «Beirut». Вместо Beirut пишите то, что нтересует (группу или песню).

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 7:52 pm    Заголовок сообщения: Ответить с цитатой

Пишет RElf (relf)
@ 2006-12-21 13:14:00
Метки данной записи: google, hack
http://relf.livejournal.com/106524.html
Цитата:
атака на кэш гугла
Не секрет, что боты гугла в целях индексации имеют доступ в такие места, куда обычный смертный просто так попасть не может. Например, гугл индексирует содержимое платных журналов. В результатах поиска хиты на такие сайты не содержат ссылок на кэш гугла. Суда по-всему, давать или не давать ссылку на кэш гугл определяет по имени сайта (даже не по IP). При этом бывают интересные сбои, когда у одного и того же сайта вдруг находится алиас, про который гугл ничего не знает. В этом случае содержимое кэша показывается, несмотря на то, что у обычного пользователя нет доступа к оригиналу. Вот например. Гугл полностью показывает статью из кэша, но открыть оригинал у вас не получится. А все потому, что алиас karger.yakeworld.ddns.info сайта content.karger.com гуглу не известен, будь та же статья найдена на последнем, гугл бы не позволил нам ее прочитать.

Отсюда возникает возможность обмануть гугл: заводим "левый" адрес с IP сайта, содержимое которого мы хотим почитать, и ждем пока гугл не проиндексирует его по нашему левому адресу (кстати, а есть методы заставить гугл что-то проиндексировать?). Ну а дальше - ищем по ключевым словам и читаем содержимое кэша.

Но совсем круто было бы научиться получать доступ к кэшу гугла произвольных сайтов без какого-либо поиска. Единственное и существенное препятствие на этом пути - некоторая сигнатура, которая сопровождает ссылки на кэш. Такие ссылки имеют вид:
google.com/search?q=cache:XXXXXXXXXXXXX:url (для обычного гугла)
scholar.google.com/scholar?q=cache:XXXXXXXXXXXXX:url (для школяра)
где XXXXXXXXXXXXX - пресловутая сигнатура, а url - заэскейпленная ссылка на сайт. Возможно, XXXXXXXXXXXXX является просто хэшем url'а, но оно же вполне может содержать (в закодированном виде) и какие-то другие параметры. Научиться бы вычислять XXXXXXXXXXXXX, и весь кэш гугла у нас в кармане...



Список форумов » Тематические обсуждения » Computer Science » Компьютерные сети и Web-технологии »
Поиск в интернете / доступ к кэшу google

http://dxdy.ru/topic13921.html
Цитата:
nckg
Вт май 06, 2008 15:11:06


Недавно наткнулся на одну любопытную особенность поиска в гугле.
Например, при поиске по ключевым словам non-Boussinesq fluid
(первый результат на 2-й странице)


можно увидеть кусок кэша страницы ScienceDirect - International ...., который выглядит примерно так:
Цитата:
However, it is important that, for a non-Boussinesq fluid with a quadratic density–temperature relation, Eq. (1) with TH=TM, the time-variation of the ...

Но на самой странице ScienceDirect - International ....
этот текст отсутствует. Похоже, что у гугла есть доступ к полным текстам статей, откуда он, видимо, и добыл эту цитату. Но простой смертный должен, вообще говоря, заплатить баксов, чтобы получить такой доступ. (конечно существуют библиотеки, где доступ есть, но посетить их не всегда возможно, да и подписки на некоторый журнал может не быть)

Поэтому возникает вопрос --- а нельзя ли поменять настройки гугла, чтобы увидеть чуть-чуть больше кэшаQuestion
И вообще, есть ли способ получения доступа к этому кэшуQuestion

Цитата:
powerZ
Чт май 08, 2008 14:00:27

Цитата:
заводим "левый" адрес с IP сайта, содержимое которого мы хотим почитать

А разве такое возможно? DNS сервер не заругаиццо?



maxal
Чт май 08, 2008 19:18:33

Там же приведен пример:
Код:
$ host content.karger.com
content.karger.com has address 194.209.48.25

$ host karger.yakeworld.ddns.info
karger.yakeworld.ddns.info is an alias for content.karger.com.
content.karger.com has address 194.209.48.25




powerZ
Пт май 09, 2008 03:40:27

Да, забавно
http://freelabs.info/UrlToIpOnline.aspx
Код:
194.209.48.25 content.karger.com
                      karger.com
194.209.48.25 karger.yakeworld.ddns.info
61.152.160.77 yakeworld.ddns.info
204.16.173.30 ddns.info

Домены 2-го, 3-го и 4-го уровня имеют разные IP. Как они это сделали?




maxal
Пт май 09, 2008 05:19:27

Так полно сервисов, которые дают динамически обновляемые доменные адреса:
http://www.dyndns.com/
http://www.cjb.net/
http://ddns.info/
и т.п.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 7:55 pm    Заголовок сообщения: Ответить с цитатой

RElf (relf) пишет в pdf
@ 2006-07-25 05:25:00

http://community.livejournal.com/pdf/266912.html
Цитата:
как качать с books.google.com
Это сообщение посвящено обсуждению возможности скачивания (частей) книг с сайта http://books.google.com
Пожалуйста, высказывайтесь и делитесь опытом в комментариях.

Для начала вкратце технология сохранения страниц: используете браузер Firefox и сохраняете сканы страниц через Tools -> Page Info -> Media ...
Для успешной работы крайне желательным является наличие аккаунта на @gmail.com.

Итак, предположим вы захотели скачать отдельную главу некоторой книги (как вариант: статью из сборника статей).

1. Ознакомьтесь с содержанием книги, как правило, оно всегда доступно. Обратите внимание на номера страниц, где расположена желаемая глава или статья.

2. Важным инструментом в нашей работе будет поиск по внутренностям книги. Поэтому запаситесь набором ключевых слов, характерных для данной главы. Это не будет проблемой, если вы примерно представляете, о чем там идет речь. Источником ключевых слов может служить название главы/статьи или индекс книги, который обычно тоже доступен. Впоследствие содержимое скачиваемых страниц может подсказать, какие ключевые слова следует использовать далее.

3. Почему так важен поиск? Дело в том, что простое пролистывание книги не даст вам уйти дальше 4-5 страниц вперед или назад. Поэтому для скачивания конкретной страницы, нужно воспользоваться поиском по ключевому слову внутри книги и посмотреть в результатах поиска номера страниц, находящиеся в пределах +/- 5 от нужной. Если такая есть - кликаем на нее и вручную долистываем до нужной. Если же нет - то ищем по другому ключевому слову и т.д. пока не повезет.

4. Когда мы попали на нужную нам страницу, можно сохранить ее на диск как написано по ссылке выше.

5. После того, как результаты поиска по одному ключевому слову исчерпаны, ищите другое слово и выжимайте максимум из результатов поиска. И т.д. и т.п.

6. При поиске по ключевому слову, гугл выделяет это слово на страницах в результатах поиска. Чтобы убрать выделение, нужно из урла выкинуть параметр vq=... Например, при поиске по слову "adiabatic" выдаваемые гуглом ссылки будут иметь вид нечто1&vq=adiabatic&нечто2. Если ее вручную можно заменить на нечто1&нечто2, то выделение слова "adiabatic" пропадет.
UPDATE: В связи с последними изменениями в интерфейсе гугл.букз рекомендуется копировать ссылку на конкретную страницу из результатов поиска и открывать ее в отдельном окне или вкладке, иначе параметр vq= внутри ссылки вы не увидите.

7. К сожалению, иногда попадаются страницы, содержимое которых гугл отказывается показывать в принципе. Можно также воспользоваться сайтом amazon.com, где также есть возможность поиска по внутренностям. Зачастую, те страницы, что отсутствуют на гугле, можно скачать с амазон, и наоборот.

UPDATE:
По наблюдению lightjedi недоступные страницы на гугл.букз становятся доступными с течением времени (и наоборот). Поэтому, если к какой-то странице нет доступа, имеет смысл попробовать снова через несколько дней и лучше с другого аккаунта.

ЕЩЕ советы:
Битая ссыла
http://forum.netz.ru/showthread.php?t=19450

Hacking Google Print(подробно на англ)
http://www.kuro5hin.org/story/2005/3/7/95844/59875

Google Error 403
А вам когда-либо по какому-нибудь запросу Google выдавал такое?
http://dmitin.livejournal.com/23841.html



Пишет Anton Shekhovtsov (svonz)
@ 2006-02-03 11:38:00
http://lj.rossia.org/users/svonz/291363.html
Цитата:
снова о books.google.com (техническое)
Это будет интересно совсем немногим, да и то, наверное, через blogs.yandex.ru, потому под кат -

Я не буду описывать общие положения касательно правильного поиска в books.google.com. Об этом можно, например, прочесть здесь.
http://www.kpnemo.ru/other/2005/06/27/obmanut_dooglu/#full
Несмотря на то, что указанный по ссылке способ с моей точки зрения представляется малоэффективным, у некоторых он работает,
http://dmitin.livejournal.com/23169.html
а это главное. Напишу краткий FAQ.

1. Какие страницы я никогда и ни за что не смогу увидеть в books.google.com?

Только те, которые в результатах поиска отмечены как [Sorry, this page's content is restricted.] Например, вы никогда не увидите (недавно выяснилось, что некоторые подобные страницы все-таки увидеть можно) страницу 118 из этой книги в books.google.com.
http://books.google.com/books?q=abortive+fascist+movements&lr=&id=544bouZiztIC&ie=UTF-8&prev=http://print.google.com/print%3F3DSearch%2BPrint&sa=N&start=0
Все остальные увидеть можно. Это ключевой момент, о котором нужно помнить всегда, и думать лишь о том, как сделать так, чтобы их увидеть.
UPD:
Недавно выяснилось, что некоторые страницы из помеченных [Sorry, this page's content is restricted.] увидеть все-таки можно.

2. В различных инструкциях по "взлому books.google.com" описывается общий поиск по номеру страницы, слову "the" или "and", названию главы, которая часто пишется в верхней части четных и/или нечетных страниц. Можно так искать?

Можно, однако данный способ эффективно работал только для прежней версии, т.е. для print.google.com. Теперь для слов навроде "the" и "and" есть программный фильтр, который выдает "the" is a very common word and was not included in your search или "and" is too general a query. Please try again with a more specific query. Поиск же по другим часто употребляющимся словам заканчивается четвертой страницей поиска, в которой вместо результатов появляется надпись Your search is too general. Please try again with a more specific query.

3. В результатах поиска появляются страницы, которые теоретически можно полностью просмотреть, но books.google.com выдает Restricted Page, хотя в результатах поиска эта страница не была помечена как [Sorry, this page's content is restricted.]. Очистка cache и cookies, вход на страницу под другим именем не помогают. Что делать?

Как я уже упоминал, books.google.com - более усовершенствованная программа, чем print.google.com. Потому могу дать следующие советы:
- Books.google.com запоминает ваш IP (обычно это касается различных типов выделенных подключений с постоянным IP). Попробуйте зайти на страницу под другим Gmail-аккаунтом через анонимный прокси-сервер. Я также пробовал временно переходить с выделенного подключения на dial-up. Иногда работает.
- Books.google.com запоминает ваш компьютер. С этим я столкнулся буквально на днях, потому еще толком не разобрался. Причем я пробовал переходить с одного компьютера (1) на работе на другой (2), где было совершенно иное Интернет-подключение, но books.google.com упорствовал, и только использование домашнего компьютера (3) спасло ситуацию. Почему 1=2≠3, я не знаю, увы.

Из камментов:
Цитата:
как цензурирует google
rahenna
2006-02-03 14:39

http://blog.outer-court.com/censored/

Разница в результатах поиска для Google.cn относительно Google.com

Цитата:
osliha
2006-09-13 09:27

Извините, что с таким опозданием отвечаю. Страницы я раньше сохраняла так -- в Мозилле "инструменты" - "информация о странице" - мультимедиа -- и там в многочисленных линках ищете изображение страницы. сохранялось в форматах jpg и еще каком-то "картинном". Но давно уже этим не занималась и новую версию Мозиллы поставила, она, кажется, как-то хуже с этим делом.




svonz
2006-09-13 10:45

>> Страницы я раньше сохраняла так -- в Мозилле "инструменты" - "информация о
>> странице" - мультимедиа

Я сейчас тоже так сохраняю. Главное в этом деле при сохранении указывать расширение .png - формат, в котором books.google выдает страницы. (Раньше сохранял черейз "Файл" -> "Сохранить как", выводя изображение напрямую [через прямой URL картинки]) С новой версией Файрфокса (1.5.0.6.) проблем не возникало. Главное .png указывать.




hentiamenti.livejournal.com
2007-12-12 02:06

Рекомендую для сохранения результатов программу ABBYY Screenshot Reader. Она поставляется с девятым проф. файнридером, ловит текст прямо с экрана; лучше всего ловить как снимок изображения в буфер обмена и потом фигачить в ворд-файл албомный по две страницы на страницу. Потом распознаете простым ридером или читаете.




(Анонимно)
2006-10-14 00:42

Mожно сохранять страницы в Опере .. Нужно выбрать File -> Save as.. и в опциях выбрать "html file with images". Тогда в папочке среди всякой лабуды будет лежать (под именем "books000") желанная страница.



books.google.com
(Анонимно)
2007-02-28 19:28 (ссылка)

Привет!
Anton Shekhovtsov писал что:
Цитата:
"...Например, вы никогда не увидите (недавно выяснилось, что некоторые подобные страницы все-таки увидеть можно) страницу 118 из этой книги в books.google.com."


Их увидеть можно. Причем без особых усилий. я при первой же попытки открыл эту страницу. причем без всяких анонимных прокси и gmail аккаунтов. Как я понял важно не тянуть сразу сильно много. Не жадничать. Все равно сразу все не прочитать.
Для себя я выбрал следующую стратегию: 1) тянуть из разных книг, по 10-15 страниц из каждой в течении дня (это оправдано, т.к. книг интересных и нужных много и совсем не обязательно качать сразу много страниц только одной книги. по чуть-чуть но из многих книг). Предполагаю, что у гугла есть порог скачивания из одного источника за определенный промежуток времени. 2) поиск осуществлять не по книге, а прямо из стартовой страницы books.google.com (это скрывает мои намерения от гугла, так как рефер происходит из общей странички поиска). 3) ключевые слова брать из последней скаченной страницы (естественно слова должны быть позаковыристее. среди них должны быть те, которые определяют тему книги, чтоб она обязательно вошла в десятку найденных гуглом). 4) лично я часто пользуюсь IE(7) и потому закачанные картинки ищю в папке C:\Documents and Settings\"user"\Local Settings\Temporary Internet Files.
Они всегда именуются books[?].*. Когда хочу их забрать использую поиск по папке (можно указать промежуток времени когда они были скачаны) и групповое переименовывание. копирую в отдельную папку и там уже обрабатываю как мне хочется.
Stalker



Re: books.google.com
(Анонимно)
2007-08-17 08:59

Что не качается на гугле часто можно выкачать на амазоне. Для этого нуже аккаунт на амазоне, с которого уже совершались покупки. Если амазон замечает, что вы выкачали три (или четыре ?) идущих подряд страницы - эта книга для вас блокируется навсегда.

Граждане, у кого есть аккаунты на амазон, давайте объединяться. В моём распоряжении есть пока один - но им я уже скачал всё что мог из нужных книг, нужны другие. В свою очередь готов повыкачивать то, что нужно другим.
gregg129@gmail.com



Re: books.google.com
svonz
2007-08-23 07:47

Что не получается найти на Амазоне можно попытаться найти на questia.com.




wazawai
2008-10-03 14:58 (ссылка)

Я вижу 118-ю страницу указанной книги. Что делать?




svonz
2008-10-03 15:26 (ссылка)

Что вы имеете в виду?



GoogleBookDownloader
cka3o4h1k
2008-11-08 02:18 (ссылка)

В вашем посту вы упоминаете эту страницу

Кроме не работающих в последнее время
http://book.huhiho.com
http://book.leechvideo.com

к вашему вниманию www.codeplex.com/GoogleBookDownloader
Для работы программы нужны .net35 и PostSharp-1.5

Качает то что доступно.




(Анонимно)
2008-12-02 17:37

Заметил такую штуку. Если просто искать книгу по имени допустим автора и названию, то ID у книги бывает разный, условно говоря "хороший" и "плохой". С хорошего можно забрать почти все, кроме тупо закрытых на (пока неясный) срок страниц. С плохого мало что удастся забрать. Забирать страницы можно без всякого поиска, просто указывая нужный номер и правильный ID. Этот способ работает лучше, чем заход на соседнюю страницу и пролистывание до нужной - нужная тогда вполне может оказаться закрытой, а если тут же зайти на нее напрямую - открытая.

условный пример: http://books.google.com/books?id=rAwdLcszTS8C&pg=PA317

Найдя драгоценную новую страничку ставлю увеличилку на максимум + F11, после чего забираю из кэша (Firefox). Не удалось забрать, сука, примерно 50 страниц из 600. Похоже на полную блокировку части контента, надеюсь временную. Помогает куча IP адресов, если она у вас есть, хорошо иметь несколько допустим линукс-аккаунтов в разных странах. Публичные прокси часто известны гуглу, и пользы от них немного. Чистка кэша и кукисов перед каждым сеансом.





(Анонимно)
2008-12-02 17:41 (ссылка)

http://books.google.com/books?id=544bouZiztIC&pg=PA118

видна сразу, что внушает надежду <>




(Анонимно)
2008-12-18 16:59

чтобы просматривать новые страницы достаточно зайти под другим брузером
вопро как открыть страницы к которым "доступ временно ограничен"
на and и the он добросовестно показывает некоторые страницы, кроме закрытых
скачал всю книгу кроме 12 страниц, время не помогает - что делать??




svonz
2008-12-18 18:42

Другой броузер мало помогает. Следует менять аккаунты и, желательно, адреса IP. Попробуйте также Tor.

Открыться страницы могут со временем, но, возможно, следует обратиться к Amazon - там часто выкладывают книги, но просматривать страницы могут только те, кто когда-либо заказывал товары в Amazon'е. Найдите такого человека (я, увы, помочь не смогу) и попросите скачать недостающие страницы.



Из камментов:
http://community.livejournal.com/pdf/266912.html?thread=703136#t703136
Цитата:
dmitin
2006-07-25 02:15 pm UTC

У меня вопрос: важно ли использование прокси?
Мой опыт общения с Google Book Search подсказывает, что использование прокси, по-видимому, не важно. Важна смена эккаунтов и чистка куков. Мне удалось
http://dmitin.livejournal.com/23169.html
когда-то выкачать почти целиком книгу (за исключением примерно четверти страниц вразброс, не доступных ни из-под какого эккаунта).

и какова вероятность того, что после нескольких махинаций можно потерять аккаунт google/amazon?
А на каком основании?
Есть Google Book Search Terms of Service
http://books.google.com/terms_of_service.html
(аналогичные, думаю, есть где-то и на Amazon). Что вы нарушаете? Вы просто осуществляете поиск в тех объемах и в той форме, в которой вам Google позволяет.
Если Google банит, то у вас просто перестает
http://dmitin.livejournal.com/23841.html
что-то находиться.

и могут ли забанить человека, сделавшего мне gmail-приглашение?
Аналогично см. выше.
И что вам мешает самому себе приглашения слать. Пока вас будут банить, вы уже скачаете что можно скачать.




relf
2006-07-25 05:23 pm UTC

> важно ли использование прокси?

вроде бы неважно

> и какова вероятность того, что после нескольких махинаций можно потерять аккаунт google/amazon?

Думаю, что близка к 0. Мы не делаем ничего такого, чтобы расценивалось как нарушение закона.
Единственное тонкое место - запись образов страниц на диск, но этот факт очень сложно будет доказать, особенно, если вы делаете это для личного пользования, а не ради дальнейшего распространения.

> и могут ли забанить человека, сделавшего мне gmail-приглашение?

Вот это точно 0. С какой стати я должен нести ответственность за действия человека, которому я всего лишь послал приглашение? Будь он хоть трижды хакер.




osliha
2006-09-13 05:25 am UTC

Аккаунт не потеряете, просто -- из собственного опыта говорю -- потеряете возможность с его помощью лить из Гугл Букс!

Цитата:
svonz
2006-07-25 08:11 pm UTC

Очень хорошая тема. ВОзможно, кому-то будут полезны мои наблюдения -
http://lj.rossia.org/users/svonz/291363.html

Цитата:
JS для ловли страниц в ГуглБукс
tatjanka
2007-12-07 12:37 am UTC

Работает под FireFox.

Идем сюда. Жмем на ссылку button правой кнопкой мышки. Выбираем добавить в закладки. Добавляем, называем, например, Ggrabber.

Идем на books.google.com, находим нужную книгу. Аккуратно просматриваем все доступные страницы.
Идем в закладки. Жмем на Ggrabber.

После этого у нас возникает html-страница со всеми доступными картинками из книги. Эту страницу сохраняем из меню "файл, сохранить как", выбрав "сохранить веб-страницу полностью" (этот процесс занимает некоторое время).

Потом в соответствующей папке (что-то_files) у нас оказывается набор картинок, которые надо правильно пронумеровать.

Или сохраняем каждую страницу отдельно правой кнопкой мышки "сохранить изображение как".

Не уверена, что это сильно удобнее, но все же.



Re: JS для ловли страниц в ГуглБукс
mononegin
2009-07-06 10:10 pm UTC

Он так и должен долго грузить? Книга на 350 страниц. Идет загрузка в firefox, страница белая. Дождусь ли я?

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 8:44 pm    Заголовок сообщения: Ответить с цитатой

Google без секретов
(операторы Гугла в практических примерах)
http://ci-razvedka.ru/Google_Search_1.html
Цитата:
08 января 2006г. с поправками от 25 мая 2007г.
Ющук Евгений Леонидович, г.Екатеринбург


Эта статья написана для тех, кто пользуется Гуглом (Google) для поиска информации в Интернете и хочет научиться делать это еще более качественно и профессионально.

Гугл становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по информации из интервью инженера по программному обеспечению Google Мэта Катса уже в 2002 году «каждые 28 дней Google индексировал 3 миллиарда веб-документов, в том числе более трех миллионов новых страниц каждый день».

В своей работе в качестве бизнес-тренера я не раз сталкивался с тем, что отсутствие русскоязычного хэлпа затрудняет работу пользователей.
Работа Дениса (liveuser)
http://www.livejournal.com/community/kubok/45852.html
по поиску через Яндекс подтвердила востребованность и практическую полезность подобных статей, как и тот факт, что не всё, написанное в хэлпах поисковых систем, своевременно обновляется.

Так была написана статья, предлагаемая вашему вниманию.

Здесь на конкретных примерах рассказывается об операторах запросов Гугла.

Основы поиска
Чтобы ввести запрос, напечатайте ключевые слова и нажмите ENTER, либо щелкните кнопку «Поиск в Google».

Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого Гугл анализирует не только саму страницу, которая соответствует запросу, но и страницы, которые на нее ссылаются, чтобы определить ценность этой страницы для целей вашего запроса. Кроме того, Гугл предпочитает страницы, на которых ключевые слова. Введенные вами, расположены недалеко друг от друга.

Показ ключевых слов в результатах.
Каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова. Тем самым облегчается обнаружение ключевых слов в тексте.

Второй способ увидеть ключевые слова – загрузить страницу по ссылке «Сохранено в кэше». Недостаток этого способа (а иногда это рассматривается как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла.

Третий способ – традиционный для просмотра текста в браузере – использовать сочетание клавиш CTRL+F. Появится окно «найти» , в которое вводятся искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.

Логическое «И».
По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса. Это соответствует оператору AND

Например:
[Кошки собаки верблюды зебры носороги]

Пример результата, сохраненного в кэше, можно видеть на странице:
{Нажмите здесь, чтобы увидеть результат}


Логическое «ИЛИ»
Пишется с помощью оператора OR. Обратите внимание, что оператор OR должен быть написан заглавными буквами. Относительно недавно появилась возможность написания логического «ИЛИ» в виде вертикальной черты ( | ), подобно тому, как это делается в Яндексе.

Например:
[Таксы длинношерстные OR гладкошерстные]

Интересно, что Гугл может показать и те страницы, на кoтopыx нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу. В таком случае при просмотре страницы с помощью ссылки «Сохранено в кэше» будет видна надпись: «Эти слова присутствуют только в ссылках на эту страницу: таксы длинношерстные гладкошерстные». Пример можно увидеть по адресу:

{Нажмите здесь, чтобы увидеть результат}


Заглавные буквы или прописные?
Гугл НЕ чувствителен к регистру букв. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Эйфелева Башня] и [эйфелева башня] дадут одинаковые результаты.

Пример результата на момент написания статьи:
Результаты 1 - 10 из примерно 91 900 для Эйфелева Башня.
Результаты 1 - 10 из примерно 91 900 для эйфелева башня.

Стоп-слова.
В хэлпах написано, что Гугл, подобно большинству поисковых машин, игнорирует стоп-слова. И, как и многие другие, имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, союзов и предлогов русского языка.

В реальности ситуация, похоже, изменилась.

Тест: вводим по-русски букву[в] . Результат:
Результаты 1 - 10 из примерно 48 600 000 для в.

Вводим по-английски артикль [the] . Результат:
Результаты 1 - 10 из примерно 8 670 000 000 для the.

Оператор «Плюс» (+)
Тем не менее, бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву “I” (Ай). Если сделать запрос просто как

[Star Wars Episode I]

То результат будет
Результаты 1 - 10 из примерно 13 200 000 для Star Wars Episode I.
В том числе в выдаче появятся слова «Episode II», «Episode IV» и т.п.

Если сделать запрос:
[Star Wars Episode +I]
то результат будет
Результаты 1 - 10 из примерно 9 290 000 для Star Wars Episode +I.
И в него войдут только тексты, содержащие слово «Episode I»

Морфология слов.
До июня 2006 года было написано " Гугл НЕ поддерживает морфологию слов. Слова надо вводить в нужных словоформах. Правда, отчасти это компенсируется интеллектуальной системой поиска, которая может найти нужную словоформу в ссылках на страницу. Чтобы убедиться в правильности утверждения об отсутствии поддержки морфологии, давайте возьмем словосочетание, по которому можно увидеть все без исключения результаты. На эту роль подходит «Глоклая куздра».


Тест:
Запрос:
[глоклая куздра]
Результаты 1 - 4 из примерно 16 для глоклая куздра.
В выдаче три адреса:
1. www.flame.ws/txt/index.php/t737.html
2. www.dom.no/modules.php?name=Forums&file=viewtopic&p=31986&highlight=
3. gb.anekdot.ru/vm.html?file=vm&date=1998-08-07

Запрос:
[глоклую куздру]
Результаты 1 - 1 из 1 для глоклую куздру.
В выдаче один адрес:
gb.anekdot.ru/vm.html?file=vm&date=1998-08-07

Запрос:
[глоклой куздре]
Результат: Не найдено ни одного документа, соответствующего запросу глоклой куздре.

Правда, это не мешает Гуглу иногда выделять по запросу «площадь» слово «площади» как релевантное. Однако подобное выделение встречается на странице выдачи, но не в кэше.

Просто для сравнения, приведу результат Яндекса. По всем трем запросам Яндекс давал на момент написания статьи одинаковый результат:
Результат поиска: страниц — 13, сайтов — не менее 5"

Однако в июне 2006 года разработчики русскоязычного Гугла сообщили, что морфологию слов Гугл поддерживает, правда делает это не совсем так. как устроен русский язык, а точнее, сознательно вводит некоторые ограничения. Это достаточно подробно описано в статье Александра Грушецкого. В связи с этим, видимо, можно считать, что для основной массы словоформ Гугл справляется со словоформами, но результаты работы со редкими словоформами, что бывает необходимо в работе специалиста конкурентной разведки, требуется провести предварителбное тестирование. Для отмены образования словоформ слово лучше заключить в кавычки.

Сравните:

Результаты 1 - 10 из примерно 2 850 000 для "женя"

и

Результаты 1 - 10 из примерно 3 510 000 для женя



Улучшение запроса во время поиска.
Поскольку Гугл выдает все слова, которые вы вводите в запросе, имеет смысл составлять новые запросы, содержащие те слова, которые вы забыли ввести в начале поиска, но нашли в ходе его выполнения в найденных текстах. В ряде случаев это может помочь улучшить поиск. Если же добавлять эти слова к уже имеющемуся запросу, то можно иногда излишне сузить диапазон результатов.

Исключение слов из запроса. Логическое «НЕ».
Как известно, информационный мусор часто встречается при составлении запроса. Чтобы его удалить, стандартно используются операторы исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус». Используя этот оператор, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.

Тест:
Запрос:
[Журавль колодец]
Результаты 1 - 10 из примерно 778 для Журавль колодец.

Запрос:
[Журавль колодец –птица]
Результаты 1 - 10 из примерно 715 для Журавль колодец -птица.

Запрос:
[Журавль -колодец –птица]
Результаты 1 - 10 из примерно 120 000 для Журавль -колодец -птица.

Запрос:
[Журавль -колодец -птица –птиц]
Результаты 1 - 10 из примерно 106 000 для Журавль -колодец -птица -птиц.

Запрос:
[Журавль -колодец -птица -птиц –журавли]
Результаты 1 - 10 из примерно 104 000 для Журавль -колодец -птица -птиц -журавли.

Поиск точной фразы.
Искать точную фразу на практике требуется либо для поиска текста определенного произведения, либо для поиска определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание.

Чтобы справиться с такой задачей при помощи Гугла, требуется заключить запрос в кавычки (имеются в виду двойные кавычки, которые применяются, например, для выделения прямой речи).

Забавным, но показательным примером может быть задание из учебника русского языка для 7 класса под ред. Н.М. Шанского. На стр. 45 приведено задание разделить текст на абзацы. Автор – М.Шолохов. Произведение не указано. Вот фрагмент текста: [«За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.»]

Введем этот текст в кавычках в Гугл и получим следующий результат:

Результаты 1 - 10 из примерно 15 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки.».

Как выяснилось, этот фрагмент относится к произведению Тихий дон / книга четвертая. А забавность примера в том, что у Шолохова этот текст оказался вообще не разбитым на абзацы.

Гугл воспринимает как знаки, связывающие слова в единую фразу, не только кавычки, но и такие символы, как дефис, слэш (косая черта), точка, знак равенства, апостроф.

Результаты 1 - 10 из примерно 27 400 для мать-и-мачеха.
Результаты 1 - 10 из примерно 27 300 для мать/и/мачеха.
Результаты 1 - 10 из примерно 27 300 для мать=и=мачеха.
Результаты 1 - 10 из примерно 27 300 для мать.и.мачеха.
Результаты 1 - 10 из примерно 27 300 для мать'и'мачеха.

Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже: «Мать-и-мачеха (Tussilago farfara) — одно из самых раноцветущих растений: зацветает в ... Как лекарственное растение мать-и-мачеха применяется, прежде всего, ...»

При этом все три слова - «мать», «и», «мачеха» рассматриваются как отдельные, но стоящие рядом и в этой последовательности. Пример можно увидеть на сохраненной в кэше странице по адресу:
{Нажмите здесь, чтобы увидеть результат}



Интересно, что по запросу [мать-и-мачеха] оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается:

Результаты 1 - 10 из примерно 27 300 для "мать-и-мачеха".

Чтобы прояснить этот казус, введем запрос такого вида:
[мать-и-мачеха -"мать-и-мачеха"]

Получим: Результаты 1 - 10 из примерно 27 для мать-и-мачеха -"мать-и-мачеха".

В выдаче появятся тексты такого содержания:

Санкт-Петербургская Федерация Настольного Футбола Матьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий ... Матьимачеха - игроки получают по 60 рейтинговых очков; Экспромт - игроки ... www.kickerclub.spb.ru/tournaments/2005-09-03.html - 17k

Количество слов в строке поиска.
Во многих источниках встречается информация, что поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск только по 10 словам. Эта информация устарела и уже не сответствует действительности.

По состоянию на 25.05.07 г. Гугл учитывал в запросе 32 слова, а все последующие слова игнорировал

Это хорошо видно, если ввести запрос, содержащий числительные подряд. Например, числа с 1 до 35. В результатах как релевантные отображаются только 32 слова запроса:

[ +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35 ]

Результат:

Результаты 1 - 10 из примерно 381 000 000 для +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35.

В выдаче:

Тематический рубрикатор

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 ...
www.amr.ru/topics/index.php?PAGEN_2=8 - 72k -

В КЭШе при этом подчеркнуты только 32 слова и в тексте они также присутствуют.



Стемминг (а также wildcard).
Стемминг – возможность усечения слова до его корня. После усечения слова до его корня производится поиск релевантных вариантов слов, производных от этого корня. Другими словами, стемминг позволяет искать все однокоренные слова.

Техника поиска по маске (wildcard) предствавляет собой написание базового слова (или части слова), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова, либо когда вы хотите включить все возможные варианты слова в свой поиск.

Например, когда по запросу [тарт*] получают как «тарталетку», так и «тартар».
Так вот, Гугл эти технологии НЕ поддерживает. Зато он поддерживает вариант, когда вместо ЦЕЛОГО СЛОВА вводится звездочка.

Например, по запросу:

[красная * площадь]

Будет выдано:
«Красная и Манежная площади», с подчеркиванием всех этих слов, в том числе буквы "и". В какой-то степени это похоже на поиск с расстоянием между словами.

По запросу:
[красная * площадь -"красная площадь"]

Будут получены результаты «Красная (Семеновская) площадь», где слово «Семеновская» не считается релевантным и не подчеркивается Гуглом.

Дополнительные операторы

Оператор cache:
Поисковая машина хранит версию текста, которая проиндексирована поисковым пауком, в специальном хранилище в формате, называемом кэшем. Кэшированную версию страницы можно извлечь, если оригинальная страница недоступна (например, не работает сервер, на котором она хранится). Кэшированная страница показывается в том виде, в котором она хранится в базе данных поисковой машины и сопровождается надписью наверху страницы о том, что это страница из кэша. Там же содержится информация о времени создания кэшированной версии. На странице из кэша ключевые слова запроса подсвечены, причем каждое слово для удобства пользователя подсвечено своим цветом.

Например:
«Это сохраненная в кэше G o o g l e копия страницы http://www.kickerclub.spb.ru/tournaments/2005-09-03.html, записанная 4 янв 2006 06:07:09 GMT.»

Можно создать запрос, который сразу будет выдавать кэшированную версию страницы с определенным адресом.

Например, запрос: [cache:www.bstm.ru] будет сразу выдавать версию страницы www.bstm.ru из кэша, а не проверять ее нынешнее состояние.

ВНИМАНИЕ: пробела между оператором cashe: и URL’ом запрашиваемой страницы быть не должно.

Если вы хотите, чтобы ключевые слова на кэшированной версии страницы были подчеркнуты, их надо через пробел указать после оператора cashe: и адреса страницы.

Например:
[cache:www.bstm.ru библиотека]

Оператор info:
Оператор info: позволяет увидеть информацию, которая известна Гуглу об этой странице.

Например, запрос: [info:www.bstm.ru] дает следующий результат:

BSTM - Бизнес-школа технологий менеджмента | Екатеринбург : Новости
phpsm, phpsitemanager. ... Президентская программа. О программе • Стратегический
менеджмент • Менеджмент качества • Маркетинг на предприятии ...
www.bstm.ru/
Google может показать следующую информацию об этом адресе:
• Показать сохраненную в Google версию www.bstm.ru
• Найти страницы, похожие на www.bstm.ru
• Найти страницы, ссылающиеся на www.bstm.ru
• Найти страницы на сайте www.bstm.ru
• Найти страницы, упоминающие ссылку "www.bstm.ru"


ВНИМАНИЕ: пробела между оператором info: и URL’ом запрашиваемой страницы быть не должно.

Оператор site:
Этот оператор ограничивает поиск конкретным доменом. То есть, если сделать запрос:
[маркетинг разведка site:www.acfor-tc.ru] то результаты будут получены со страниц, содержащих слова «маркетинг» и «разведка» именно в домене «acfor-tc.ru» , а не в других частях Интернета .

Если сделать запрос
[scip site:ru] то будут получены документы, содержащие слово «scip» и расположенные в доменной зоне «.ru».

ВНИМАНИЕ: пробела между оператором site: и URL’ом запрашиваемой страницы быть не должно.

Оператор link:
Этот оператор позволяет увидеть все страницы, которые ссылаются на страницу, по которой сделан запрос.

Например, по запросу:
[link:www.livejournal.com/community/kubok/45852.html]
Будут получены известные Гуглу ссылки на статью о поиске через Яндекс, написанную liveuser.

ВНИМАНИЕ: пробела между оператором link: и URL’ом запрашиваемой страницы быть не должно.

Оператор allintitle:
Если запрос начать с оператора allintitle: , что переводится как «Все – в заголовке», то Гугл выдаст тексты, в которых все слова запроса содержатся в заголовках (внутри тега Title в HTML).

Например, запрос

[allintitle: википедия яндекс]
даст результаты, где слова «википедия» и «яндекс» содержится внутри тега Title на просмотренных поисковой машиной страницах.

На момент написания статьи результат был таким:

Результаты 1 - 3 из примерно 7 для allintitle: википедия яндекс.

Оператор intitle:
Показывает страницы, в кoтopыx только то слово, которое стоит непосредственно после оператора intitle: , содержится в заголовке, а все остальные слова запроса могут быть в любом месте текста. Если поставить оператор intitle: перед каждым словом запроса, это будет эквивалентно использованию оператора allintitle:

[intitle:википедия яндекс]
На момент написания статьи результат был таким:
Результаты 1 - 10 из примерно 888 для intitle:википедия яндекс.

ВНИМАНИЕ: пробела между оператором intitle: и последующим словом быть не должно.

Оператор allinurl:
Если запрос начинается с оператора allinurl: , то поиск ограничен теми документами, в которых все слова запроса содержатся только в адресе страницы, то есть в url.

Так, на момент написания статьи для запроса:

[allinurl: narod razvedka]
Результат был таким:
Результаты 1 - 10 из примерно 14 для allinurl: narod razvedka.

ВНИМАНИЕ: оператор allinurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, т.к. могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос

[allinurl: narod.razvedka] , равно как и [allinurl: narod/razvedka] результата не дал вообще.

Оператор inurl:
Слово, которые расположено непосредственно слитно с оператором inurl: , будет найдено только в адресе страницы Интернета, а остальные слова – в любом месте такой страницы.

Например, для того, чтобы найти слово «разведка » на сайтах, содержащих в адресе сочетание букв «tc», можно сделать такой запрос:

[inurl:tc razvedka]
Результат на момент написания статьи:
Результаты 1 - 1 из 1 для inurl:tc razvedka.

И был представлен текстом: «Otryady-5 Razvedka okazalas' neskol'ko utomitel'noi (obratno shli V lavirovku). Poetomu k pirsu my podoshli sovershenno izmuchennye: no ne stol'ko samoi razvedkoi, ... www-lat.rusf.ru/tc/tc08/08otr5.htm».

Если оператор inurl: поставить перед каждым словом запроса, это будет эквивалентно использованию оператора allinurl:

ВНИМАНИЕ: пробела между оператором inurl: и и последующим словом быть не должно.

ВНИМАНИЕ: оператор inurl: работает только со словами, но не со служебными фрагментами URL. Такие специальные символы, как слэш или точка не окажут положительного влияния на результат. Зато они окажут отрицательное влияние, т.к. могут быть восприняты Гуглом как попытка ввести в запрос точную фразу. Например, запрос

[inurl:tc/razvedka] , равно как и [inurl:tc.razvedka] результата не дал вообще. Результат мог бы быть, если бы в адресе какой-то страницы содержаласть точная фраза «tc/razvedka» или «tc.razvedka». В этом можно убедится, введя запрос:

[inurl:kubok]
Результаты 1 - 10 из примерно 28 400 для inurl:kubok.

И этот результат начинается с текста: «Кубок Яндекса Как искать эффективно • Вопросы и ответы • Предложение организаторам соревнований • Форум • Кубок в LiveJournal kubok ... kubok.yandex.ru

[inurl:kubok/45852]
Результаты 1 - 2 из примерно 44 для inurl:kubok/45852.

И этот результат начинается с текста: «kubok: Хозяйке на заметку Хозяйке на заметку. Материал рассчитан на подготовленного читателя, знающего, что такое стоп-слова и операнды, чем '~~' отличается от '&&' и зачем их ... www.livejournal.com/community/kubok/45852.html»

Оператор related:
Этот оператор описывает страницы, которые «похожи» на какую-то конкретную страницу. Например, запрос

[related:it2b.ru]

Дает результат:
Результаты: 1 - 10 из приблизительно 29 подобных it2b.ru.

Я бы не сказал, что все страницы действительно подобны странице сайта it2b.ru , с точки зрения человека. Хотя некоторые страницы действительно посвящены подобной тематике.
Первым в выдаче стоит непосредственно сам сайт it2b.ru, посвященный вопросам использования технологий разведки для бизнеса. А вот вторым – сайт компании "SW-Trans", предлагающей услуги по перевозке грузов.
Могу предположить, что основанием для уподобления двух сайтов послужило упоминание на сайте грузовой компании услуг по охране грузов, их сопровождению машинами со спецсигналами, о спецпропусках и о «решении всех возможных дополнительных проблем, возникающих при транспортировке». Наряду с транспортной компанией, Гугл засчитал в подобные страницы и такие объяснимые ресурсы, как журнал «Sales/Business (Продажи)», в котором встречается немало публикаций о предпринимательских рисках и о конкурентной разведке, а также компанию «Информзащита», работающую в области обеспечения информационной безопасности.

ВНИМАНИЕ: пробела между оператором related: и и последующим словом быть не должно.

Оператор define:
Этот оператор выполняет роль своего рода толкового словаря, позволяющего быстро получить определение того слова, которое введено после оператора.

Например:

[define: разведка]

Результат:

Определения разведка в интернете: совокупность мер для сбора данных о действительном или возможном противнике. www.examen.ru/db/Examine/catdoc_id/50EFFB02B0ADF8B2C3256A3A003D797D/rootid/9327995FB7A6D40FC3256A02002CE0D5/defacto.html

Интересной особенностью оператора define: является его способность искать определения фразам. В качестве фразы он понимает все слова, написанные после оператора, в том числе и написанные без кавычек, просто через пробел

Например:

[define: большой взрыв]

Результат:

Определения большой взрыв в интернете: Большой Взрыв — взрывной процесс в котором, по данным современной науки, наша Вселенная родилась из так называемой космологической сингулярности. ru.wikipedia.org/wiki/Большой_Взрыв

Правда, иногда этот оператор может и повеселить, либо дать материал для проведения КВН с вопросами, на которые мало кто ответит. Например, по запросу:

[define:ложка]

Результат:
Определения ложка в интернете:
* блесна, основанная на подражании раненой рыбке.
fisherman.com.ua/files/fishsay.php

А по запросу :

[define:осёл]

Результат:
Похожие фразы: буриданов осёл

Определения осёл в интернете:
* строгий, собранный в кучу, материал
astro.rin.ru/htmls/nostradamus/astro1826-5.html

ВНИМАНИЕ: наличие или отсутствие пробела между оператором define: и последующим словом на результате не сказывается.

Поиск синонимов.
В хэлпе Гугла сказано, что если вы хотите найти тексты, содержащие не только ваши ключевые слова, но и их синонимы, то можно воспользоваться оператором «~».

Мне не удалось найти подтверждения этому утверждению.

Так, я сравнил два запроса и не нашел разницы:

[~опережающий ~разведка]
Результаты 1 - 10 из примерно 33 100 для ~опережающий ~разведка.

[опережающий разведка]
Результаты 1 - 10 из примерно 33 100 для опережающий разведка.

Поиск числовых значений.
Для тех, кому приходится работать с цифрами, Гугл дал возможность искать диапазоны между числами. Для того, чтобы найти все страницы, содержащие числа в неком диапазоне «от - до», надо между этими крайними значениями поставить ДВЕ ТОЧКИ.

Например, по запросу

[численность населения 1913..1917]

Будут выданы страницы
Народная энциклопедия городов и регионов России. Города. Санкт ... Подчиненные поселки городского типа, численность населения на 1.01.2000 ... Вскоре после начала Первой мировой войны актом от 18 (31) августа 1914 г. ... rfdata.al.ru/auto/city/18/667.HTM

С выделенным числом «1914»

И

Известия Уральского государственного университета № 9(1998 ... За 192 года своего существования с 1723 по 1915 гг. численность населения города увеличилась в 28 раз, достигнув 112 тыс. чел. Следует отметить, что город ... proceedings.usu.ru/.../0009(03_05-1998)&#xsln=showArticle.xslt&id=a14&doc=../content.jsp

С выделенным числом «1915»

Подобный пример приведен в хэлпе Гугла на примере цены DVD:

[DVD player $50..$100]

Кнопка «Мне повезет» (в английском варианте - "I'm Feeling Lucky")
Кнопка «Мне повезет» расположена на главной странице Гугла. На мой взгляд, это замечательная идея. По этой кнопке Гугл выдает наиболее релевантный, с его точки зрения, результат. Обычно это помогает при быстром поиске какой-то фактической информации, когда не требуется подробного изучения вопроса. После нажатия кнопки «Мне повезет» вы попадаете непосредственно на сайт, который Гугл предлагает в качестве искомого.

Например, запрос по кнопке «Мне повезет»

[активные формы]

Открывает непосредственно сайт одноименной консалтинговой компанииhttp://www.acfor.ru/

Расширенный поиск.
Для тех, кто в целом понимает, как работает поисковая машина, но не хочет запоминать операторы запросов, и при этом согласен на потерю части информации, подойдет страница расширенного поиска. Такие страницы, по мере развития и «поумнения» поисковых машин становятся всё более популярными не только у обывателей, но и у профессионалов конкурентной разведки, во всяком случае, на Западе.

Ресурс "Мир Google" (на русском языке)
http://mir-google.ru/

Группы Google

Gmail Orkut Invites - общение пользователей Оркут; получить инвайт в Gmail или Оркут.

Google Research - общение людей, интересующихся Google href="http://groups.google.ru/group/Mir-Google-Talk">Google Talk - группа для пользователей Google Talk

Gmail - общение с пользователями Gmail

Google Desktop - использование программы

Google Analytics - работа с системой анализа сайтов

Мир Google - группа разработчиков сайта Мир Google

Google Maps - фото Земли со спутника

Google AdSense - иструкции пользования Google.org - благотворительный отдел Google

Google Base - перспективы, применение сервиса

Веб-мастер Клуб

Линукс - группа о Linux

Софтодром - общение пользователей программного обеспечения

Gmail - õîðîøàÿ ïî÷òà îò Google Достоинства сервиса: 1) размер (более 2 Gb); 2) отсутствие рекламы* как в интерфейсе почты, так и в тексте писем; 3) новаторская система сортировки сообщений по заголовкам. Это означает, что письма с одинаковыми заголовками будут помещены на одной странице, комфортно предоставляя обзор к истории предыдущей переписки. узнать больше о Gmail... получить аккаунт в Gmail...

Orkut
Более 10 миллионов пользователей со всего мира уже стали участниками Оркут. Это уникальное место, где вы можете смотреть портфолио других людей со всего мира, знакомиться и общаться. Регистрация только по приглашению делает его еще привлекательней. узнать больше...

Google Base
Компания Google завершила свой первый суперпроект, из целой серии, призванных полностью заменить собой устеревающий интернет. описание сервиса...

Google Analytics
Аналитическая система сайтов от Google в руках профессионала становится мощнейшим инструментом ведения бизнеса, а для веб-мастера - любителя может стать дорогой, качественной но в то-же время бесплатной игрушкой.
прочитать еще... Google Analytics - домашняя страница...

AdSense
Это простой способ начать зарабатывать деньги, показывая подходящие по смыслу к вашему сайту рекламные объявления. домашняя ñòðàíèöà Google AdSense...

Google Talk
Общаться в интернете можно не только с помощью мгновенных сообщений (как ICQ или MSN), сегодня стало возможным использовать бесплатную интернет-телефонию. Все что для этого нужно - микрофон и второй человек "на проводе". Одновременно Google Talk осведомляет пользователя о новой почте с помощью всплывающих сообщений. подробнее... скачать программу...

Google Groups - áîëüøå ÷åì ôîðóì Работая в тесной связке с Gmail, Google Groups делает процесс общения невероятно эффективным. Не нужно заходить на форум, чтобы узнать об ответах на ваше сообщение, теряя драгоценное время. Ответы приходят к вам в ящик, и склаываются "встопку" как в форуме. Даже если вам придут десятки сообщений, система Gmail с легкостью с ними справится, не позволив вам запутаться. группы гугл - подробнее...

Google Desktop - настольный гугл Новинка! (по состоянию на 10.02.06 - прим. Е.Л. Ющука) Программа - персональный поисковик на компьютере среди десятков тысяч документов на вашем компьютере. Индексирование длится часы... а поиск после этого -миллисекунды. Программа в потенциале способна заменить привычный интерфейс Windows, предоставляя доступ к файлам в обход традиционных методов доступа к ôàéëàì. ВНИМАНИЕ! Если Вы считаете, что на Вашем компьютере содержатся конфиденциальные данные, то Вы должны знать, что, согласно проведенным исследованиям о работе второй версии поисковой программы Гугла для персональных компьютеров, а также по информации самого Гугла о третьей версии поисковика, данные могут уходить с Вашего компьютера. (прим. Е.Л.Ющука) скачать Google Desktop... прочитать о функциях программы Google Desktop... скачать подключаемые модули для Google Desktop...

Google Maps - спутниковое фото Земли Обозревайте нашу планету из Космоса. Спутниковые снимки всей поверхности Земли от NASA стали доступны обычным пользователям. узнать больше... посмотреть на Землю со спутника...
Спутниковое фото на «Мир Google». Информация о Гугл Мапс
Спутниковое фото на «Мир Google». Москва
Спутниковое фото на «Мир Google». New York - Остров Либерти, Статуя Свободы
Спутниковое фото на «Мир Google». Париж - Эйфелева Башня



Службы Google (англоязычные)

Google Local - находит местные предприятия и услуги в интернете

Google Mac - поиск по сайтам тематики Apple/Macintosh

Google’s University Search - поиск по университетам

Google Linux - поиск по сайтам тематики Linux

Google GOV - поиск по всем государственным (*.gov) и военным (*.mil) сайтам

Froogle - поиск товаров/продукции

Google Options - опции

Google Map Site - карта сайта

Google Features - перечень разнообразных особенностей

Google Microsoft - поиск по сайтам Microsoft

Google Labs - сервисы

Hacker Style Google - в оригинальном стиле

Google BSD - поиск по BSD-сайтам

Google Наоборот - google в зеркальном отображении

Google Schoolar - поиск среди статей, книг и обзоров научной литературы и учебников

Google Firefox - для фанатов Mozilla Firefox

Google Fight - поединок: вводите два слова, и поисковик показывает какое из них ссылается на большее количество страниц

Google Suggest - возможные варианты того, что вам нужно, с показом количества страниц по данному запросу

Cheatoogle - поиск по читам и кодам к играм

Google Easter - пасхальный кролик

Gmail - почта от Google

Video google - поиск видео

Google для мобильников и КПК - мини-версия для удобной работы с мобильных телефонов и КПК

Mobie Google - ещё один сервис для сотовых

Google Fan Logos - сайт с логотипами на тему Google

Google Hiliday Logos - праздничные логотипы

Официальные и Неофицальные - логотипы Google

Google April Fools - поиск о всём, что связано с днём дураков

Google Maps - поиск по картам

Google Blog - официальный блог Google

Google News - новости от Google

Google Print - поиск Google по миллионам оцифрованных книг библиотек Гарварда, Стэнфорда, Оксфорда, Мичигана, а также из Нью–Йоркской Публичной библиотеки

Google Earth - программа для осмотра Земли из космоса

Can’t find on google - сайт со списком различных запросов, в ответ на которые выдаётся не то, что нужно

GoogleGulp - напитки от Google

Uncle Sam - "патриотический" поисковик

Blogsearch - поиск по блогам и ЖЖ

Google Webmasters Guidelines - информация и советы Google для вебмастеров

Google Reader - Google Reader

Google Code - для кодеров, открытые исходники и т.д.

Google VPN - бесплатный VPN-сервис от Google

Google Alerts - отслеживает появление новых страниц на поисковый запрос и уведомляет об этом на e-mail

Google Answers - задаёте вопрос, указываете сумму вознаграждения за ответ и ждёте ответа

Personalized Google Search - поиск с учётом ваших настроек и потребностей

GoogleStore - магазин с аксессуарами в стиле и с логотипами Google

Google Trade Catalogs - каталог товаров

Google Personalize Homepage - настройте поиск и внешний вид Google под себя Wink

Google Base - база данных от Гугл, закачайте всё что хотите
Сводная таблица операторов Google, приведенных в статье. Открыть или загрузить файл Word размером 48кБ


Литература:
1. http://www.google.ru/support/bin/topic.py?topic=352
2. http://www.google.ru/support/bin/answer.py?answer=504&topic=352
3. http://www.google.ru/help/refinesearch.html
4. http://www.google.ru/help/operators.html
5. http://www.google.ru/help/interpret.html
6. http://www.google.com/help/basics.html
7. http://www.google.com/help/operators.html
8. http://www.google.com/help/refinesearch.html
9. http://propel.ru/pub/34.php
10. http://search.ufl.edu/user_help.html
11. http://www.cavendishpublishing.com/html/dxsearchfaqs.asp#help6
12.http://www.searchengines.ru/articles/004532.html
13.http://www.livejournal.com/community/kubok/45852.html
14. 3DNews.ru. «В гостях у Google `2006» 1 февраля 2006г.
15.Книга "Конкурентная разведка: маркетинг рисков и возможностей", Е.Л. Ющук. Москва, издательство деловой литературы "Вершина.", 2006г.




Обсуждение статьи и некоторые дополнительные материалы, пока что в нее не вошедшие, можно увидеть
на блоге Е.Л. Ющука внизу страницы по этой ссылке:
http://yushchuk.livejournal.com/35905.html

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 9:06 pm    Заголовок сообщения: Ответить с цитатой

Справка Google: функции поиска
http://www.google.com/intl/ru/help/features_list.html

Поиск информации в Интернете/Google — Викиучебник
http://ru.wikibooks.org/wiki/Поиск_информации_в_Интернете/Google
_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 9:25 pm    Заголовок сообщения: Ответить с цитатой

Старые, полезные "баяны".
Cool

Конкурентная разведка (Competitive Intelligence)
http://yushchuk.livejournal.com/35905.html
Цитата:

Ссылки:

Конкурентная разведка

Обучение конкурентной разведке

Невидимый Интернет

Ющук Евгениq Леонидович. Компания "Маркетинг рисков и возможностей".

Конкурентная разведка и Информационная война

Сообщество Практиков конкурентной разведки (СПКР)

Как искать в Гугле. Операторы Google.

Статья «Кадровая дилемма в конкурентной разведке: «Маркетологи» или «Безопасники»

Открытый бесплатный мастер-класс Ющука Евгения Леонидовича.

Ющук Евгений Леонидович "Конкурентная разведка против PR-технологий

Нежданов Игорь Юрьевич. Аналитическая разведка

C поличным. Кузнецов Сергей Валентинович пойман российской конкурентной разведкой. (Kuznetsov Sergej Valentinovich has been inculpated by Russian competitive Intelligence)

Пример работы конкурентной разведки по объекту Кузнецов Сергей Валентинович

Информация на объект в конкурентной разведке: Кузнецов Сергей Валентинович

Мастер-класс Ющука Евгения Леонидовича на "Деловом Квартале".

Противодействие черному PR в Интернете методами конкурентной разведки.

Выпускники Ющука Евгения Леонидовича в борьбе против черного пиара

Кузнецов Сергей Валентинович как объект успешной операции конкурентной разведки

Форум по Конкурентной разведке

Блог поддержки мастер-класса Ющука Евгения Леонидовича по противодействию черному пиару в Интернете.

Ющук Евгений Леонидович. S7.

Сообщество практиков Конкурентной разведки (СПКР)

Форум разведчиков на сайте Р-Техно it2b

Форум практиков конкурентной разведки на сайте РСБ

Конкурентная разведка в Казахстане

Черный PR

Черный список отозванных лицензий

Малютин. Маркер.

Дезинформация и активные мероприятия в бизнесе

Авиакомпания S7. За и против S7 Airlines.

Ющук Евгений Леонидович/ Сайт "Конкурентная разведка" на "Народе"

Блог "Экономическая разведка"

Корпоративные блоги. Ющук Евгений Леонидович

Пример конкурентной разведки. Аккумулирование фактов незаконной и нелицеприятной деятельности Кузнецова Сергея Валентиновича

Кузнецов Сергей Валентинович и Уголовный Кодекс. Мнение профессионалов конкурентной разведки

Интернет вместо телевизора. О Кузнецове Сергее Валентиновиче.

Газета Маркер

Кузнецов Сергей Валентинович и профанация компьютерной разведки через Интернет

"Закрой лохотрон - спаси лоха". Юмор в информационной войне - на примере Кузнецова Сергея Валентиновича

О Кузнецове Сергее Валентиновиче - объекте конкурентной разведки

Кузнецов Сергей Валентинович. Лысенковщина в чистом виде.

Аналитики конкурентной разведки в информационной войне. Пример аналитических статей по публикациям объекта конкурентной разведки

Plagiarist SERGE KUZNETSOV (KUZNETSOV Sergej Valentinovich) In

Online Competitive Intelligence and Invisible Web.

Партизанский маркетинг в Интернете. продвижение методами конкурентной разведки.

Борьба с негативом в блогах и на Интернет-форумах

Надувательство? Конкурентная разведка через Интернет. Кузнецов

Сергей (Kuznetsov Sergej Valentinovich) "Onine Competitive Intelligence” plagiarism in Russia

Мониторинг Интернета и анализ результатов мониторинга

Боевой блоггинг - инструмент конкурентной разведки

Yushchuk Evgeny Leonidovich (Evgeny Yushchuk )

Корпоративная разведка

Конкурентная разведка и маркетинговые исследования



Невидимый Интернет
http://ci-razvedka.com/


Работа в интересах вашего бизнеса в Интернет-форумах, социальных сетях и блогосфере. Борьба с негативом и профилактика негатива в Интернет-форумах, социальных сетях и блогоосфере
http://razvedka-internet.ru/Rabota-v-Internet-Forumakh.html


Мониторинг информации в Интернете, мониторинг блогосферы (блогов), мониторинг социальных сетей и мониторинг Интернет-форумов
http://razvedka-internet.ru/Moitoring-Interneta-blogov-forumov.html

Ну и так далее..
_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пт Сен 10, 2010 10:09 pm    Заголовок сообщения: Ответить с цитатой

Ещё один старый "баян", для примера:

Боевой блоггинг - инструмент конкурентной разведки
http://ci-razvedka.ru/Warrior-Blogging.html
Цитата:
Источник: Статья Боевой блоггинг - инструмент конкурентной разведки

Автор: Евгений Ющук


Эта статья посвящена действиям конкурентной разведки в блогосфере, которые близки к "активным мероприятиям" по терминологии государственных спецслужб. Подобные действия могут осуществляться конкурентной разведкой, как в ходе "мирных" маркетинговых мероприятий, так и в ходе информационной войны. Поэтому такая разновидность блоггинга расценивается мною как боевой блоггинг.

Люди все больше времени проводят в виртуальном мире. Влияние виртуального мира на реальный также становится все ощутимее. Истории об уволенных за свои высказывания блоггерах общеизвестны. Правдивы и истории о соискателях вакансий, получивших отказ после прочтения потенциальным работодателем их блога. И о получении информации о планах конкурента из блогов его сотрудников.


Блоги – переворот в Интернет-журналистике и в распространении информации.



Блоги совершили переворот в Интернет-журналистике. Они позволяют любому человеку общаться со всем миром напрямую, без посредников. Система так называемях «френдов» позволяет распространять новость в блогах с невероятно большой скоростью, поверх государственных границ и независимо от расстояний.

Уже стихийно выстроилась неформальная, но реально существующая иерархия блоггеров и блоговых площадок. Несмотря на обилие мифов, появились реальные возможности зарабатывать в блогосфере деньги.

В общем, блоги, похоже, прочно вошли в жизнь людей, потеснив такие привычные формы интерактивного общения, как Интернет-форумы. Мы не будем подробно останавливаться в этой статье на сходстве и различиях блогов и форумов, а рассмотрим лишь те из них, которые делают блоги полезными для конкурентной разведки – прежде всего, при легендировании деятельности специалистов конкурентной разведки, создании дезинформации или участии конкурентной разведки в управлении репутацией предприятия.


Блоги – следующий шаг Интернет-эволюции после форумов. Шаг, судьбоносный для конкурентной разведки.



В контексте задач конкурентной разведки, основное сходство блога и Интернет-форума, в том, что и Интернет-форум, и блог имеют очень высокий рейтинг доверия у «жителей Интернета».

Пользователь, читающий материал на блоге или форуме, как правило, уверен, что видит текст, созданный обычным (то есть неангажированным) человеком. А, встретив однотипный по информационному и эмоциональному наполнению материал на разных форумах и блогах, читатель подсознательно склонен считать, что информация проверена им, так как получена из разных, источников, причем не связанных между собой.



Стало совершенно очевидно, что информационное пространство с таким высоким уровнем доверия конкурентной разведке выгодно преобразовать в нужном для себя направлении.

Однако преобразование информационного поля на Интернет-форуме – процесс трудоемкий.

Причин этому несколько:

(кстати - держим в уме историю с беркем.ру. us998 Cool )


1. На Интернет-форуме есть модераторы, которые следят за тем, чтобы беседа не уклонялась от заданной темы. А значит, надо либо заводить нужную тему, либо подлавливать удобный момент для вброса информации.

2. Интернет-форумы фиксируют дату размещения материала и пользователь не в состоянии произвольно ее менять. Это не очень удобно в случаях, когда желательно датировать материал не реальным днем его размещения, а «задним числом». И таких случаев большинство.

3. Любой участник Интернет-форума может процитировать ваше сообщение и его уже невозможно будет изменить, не привлекая внимания окружающих. Сообщение, размещенное на форуме, с большой степенью вероятности может выйти из-под вашего контроля.

4. Любой участник Интернет-форума может устроить так называемый флуд (обсуждение второстепенных или вообще не имеющх отношения к теме вопросов, зачастую совершенно неинформативное), превратить дискуссию в скандал или каким-либо иным способом спровоцировать модератора на удаление «ветки» или ее блокирование. А если важная для конкурентной разведки информация находится не на первой странице ветки форума, то ее вообще могут никогда не найти, если страниц в ветке будет достаточно много.

5. По Нику каждого участника форума легко увидеть количество его сообщений на форуме и можно прочитать эти сообщения. Поэтому сразу бросается в глаза человек, который пришел на форум только ради «слива» информации. И степень доверия к такому человеку резко снижается, часто сводя на нет все усилия специалиста конкурентной разведки по изготовлению и вбросу информации.



Блоги лишены практически всех этих недостатков.

Давайте рассмотрим применительно к блогам все те же вопросы, что и по форумам. В той же последовательности.

1. Модератором блога является сам его владелец. Никто не может вмешаться в его деятельность (за исключением владельца всей блоговой площадки, который может иногда вмешиваться при нарушении правил ведения блога, принятых на площадке). Тему владелец блога определяет сам и размещает он эту тему тогда, когда сочтет нужным.

2. Дата размещения материалов на многих блоговых площадках может выставляться владельцем блога произвольно. Выставить год, когда Интернета еще не было – например, 1812-й или 1905-й, обычно не получается. Но год, когда Интернет уже работал - скажем, 1995-й – вполне. Вот пример подобной статьи, специально для этого размещенный на моем блоге «Конкурентная разведка».

3. Изменить размещенный владельцем блога материал никто из читателей не может.

4. Флуд в принципе возможен в комментариях, но владелец блога может в любой момент запретить доступ любому пользователю, либо вообще всем пользователям, либо разрешить доступ только определенным пользователям. Удалить любой комментарий любого участника дискуссии владелец блога также может в любой момент.

5. Владелец блога может создавать в своем блоге любое количество сообщений, в том числе и в течение одного дня. Он может датировать сообщения, размещенные в течение одного дня, настоящей или произвольно выбранной датой.

Таким образом, блоги можно считать едва ли не идеальным инструментом для целей конкурентной разведки. Тем более, что создание блога бесплатно и он полностью подконтролен своему владельцу.


Техника преобразования информационного пространства с помощью блогов.

Часть действий по созданию боевых блогов с целью преобразования информационного пространства одинакова для всех целей. А часть таких действий зависит от того, ради чего боевой блог создается.
Действия, которые надо совершить, независимо от целей создания боевых блогов.

1. Блог регистрируется на блоговой площадке.

Таких площадок неимоверно много. Самые распространенные в рунете – LiveInternet и LiveJournal . Но кроме них практически в каждой стране есть площадки для ведения блогов, и есть даже самостоятельные площадки во многих крупных городах – на городских порталах. Найти их через поисковые машины не составляет труда. Выбирают площадку либо ориентируясь на предпочтения целевой аудитории, либо по прингципу «чем больше – тем лучше». Хотя в большинстве случаев выбор делается в пользу уже упомянутых LiveInternet и LiveJournal, поскольку они хорошо индексируются русскоязычными поисковыми машинами и на них много пользователей, в том числе и относящихся к целевой аудитории.



2. Имитируется блог реального человека.

Для этого достаточно определиться с нужными датами – так, чтобы блог смотрелся естественно, исходя из целей, ради которых он создавался. Иногда это должны быть давние даты, по отношению к событию, которое стало реальным поводом для его создания, иногда – наоборот. Соответственно, разным будет и количество постов (сообщений) в блоге.

Затем выбирается тема блога. На этом этапе часто принимается решение, что блог будет представлять собой так называемый «Лытдыбр» - нетематический блог, похожий на обычный дневник простого человека.
Для справки:
слово «лытдыбр» - это написанное в английской раскладке клавиатуры русское слово «дневник» - «lytdybr».

При этом требуется решить проблему креативности, преодолеть которую самостоятельно, как известно, не каждому под силу.
Самый простой способ сделать это – взять за основу сообщения в блогах реальных людей.
Найти их несложно: они ищутся в Блогах Яндекса, либо по запросу (например, «гулял с собакой» или «устал»), либо без запроса - среди людей, записавших в друзья известных блоггеров.

Достаточно просто кратко пересказать своими словами сюжет поста реально существующего человека, не забывая о том, от мужского или женского персонажа размещается материал в блоге.
Такой пост получится у вас оригинальным и правдоподобным. Оригинальность текста важна, поэтому просто копировать в свой боевой блог чужие посты нельзя.
Оригинальность текстов, маскирующих боевой блог под обычный, важна не только с точки зрения качества легендирования боевого блога, но и с точки зрения соблюдения авторских прав блоггеров, взятых за образец.



3. В блог вставляются тексты и/или нетекстовая информация, ради которых он и создавался.

Эти тексты и нетекстовая информация должны быть составлены так, чтобы в максимальной степени соответствовать поставленной перед блогом задаче.
Здесь не может быть шаблонного подхода.
При составлении контента часто, но не всегда надо соблюдать правила, применяемые специалистами по поисковой оптимизации (SEO).

При создании боевого блога или группы боевых блогов есть различия, зависящие от целей их создания.

Давайте рассмотрим наиболее часто встречающиеся варианты.


Основные разновидности боевых блогов и действия, которые надо совершить, в зависимости от целей создания боевых блогов.



1. Блог-«легенда»

Задача такого блога – подтвердить «легенду» реального человека или виртуального персонажа.
Такой блог содержит ту информацию, которая соответствует выбранной легенде.
Этим и определяется количество сообщений в блоге, их содержание и даты.
Сообщения, размещенные «задним числом», не отобразятся в «Блогах Яндекса», поэтому их размещение останется незамеченным противником.



2. Блоги-«аэростаты»

Все наверняка видели в фильмах о Второй Мировой войне заградительные аэростаты, висящие над городами. Часто к таким аэростатам привязывали металлическую трубу или рельс. Задача аэростатов состояла в том, чтобы самолеты противника при снижении терпели аварию, натыкаясь на сам аэростат, на канат, удерживающий его, или на привязанный к нему металл.

Примерно по такому же принципу действуют боевые блоги, о которых мы говорим.

Их задача состоит в том, чтобы при Интернет-серфинге целевая аудитория, как можно чаще натыкалась на размещенную там тематическую информацию, которая формирует у читателя (зрителя) соответствующее отношение к обсуждаемому вопросу.

Это может быть информация рекламного характера или дезинформация о планах предприятия, или информация, дискредитирующая противника и так далее.

Как правило, сообщение, рассчитанное на целевую аудиторию, может быть единственным таким сообщением на блоге, а все остальные его сообщения – имитация деятельности рядового блоггера.

Но повторюсь еще раз:
сообщение, рассчитанное на целевую аудиторию на блоге-«аэростате», должно быть оригинальным.


Тогда у читателя создается иллюзия, что он познакомился с мнением большого количества разных людей. Степень доверия такой информации будет выше.



3. Блог-«пересмешник»

Это разновидность блога-«аэростата», которая отличается одной особенностью: контент, влияющий на целевую аудиторию, не оригинален, а представляет собой перепечатку с другого блога. При этом блог, с которого копировался материал, указан как источник текста.
Это дает возможность поставить на него активную ссылку и продвинуть блог-источник в выдаче поисковых машин.



4. Блог-«торпеда»

Задача этой разновидности блога – «пробить» ресурсы противника в выдаче поисковых машин и встать выше них или просто рядом с ними. Контент такого блога «заточен», как правило, под название предприятия противника или имя персоны-мишени или другие их идентификаторы, по которым их ищут в Интернете представители целевой аудитории.
У противника практически нет шансов устоять перед атакой «торпед», поскольку боевой блог этого типа имеет, как минимум, три преимущества перед обычным корпоративным (или личным) сайтом противника:

· Блог-«торпеда» «заточен» под название противника, тогда как сайт противника «заточен» под его товары или услуги. Количество ключевых слов на таком блоге, как правило, значительно выше, чем на сайте-мишени.

· Блог-«торпеда» очень мобилен. Это значит, что его контент может быть легко переброшен на любой адрес в Интернете. Ведь в блоге-«торпеде» главное – контент, а не адрес, тогда как для корпоративного сайта потеря адреса может быть катастрофой

· Блог-«торпеда» очень дешев и его можно быстро изготовить. Это делает его практически неуязвимым для возможных ответных мероприятий противника или антиспамовых фильтров поисковых машин. Потеря «торпеды» практически ничего не значит для его владельца: во-первых, перед гибелью «торпеда» успевает оказать информационное воздействие на аудиторию, а, во-вторых, на смену потерянной «торпеде» немедленно водится в строй новая «торпеда» и, как правило, не одна. Противник, вставший на путь борьбы с «торпедами», будет лишь бесполезно тратить силы, время и деньги, участвуя в заведомо проигрышной для себя гонке.



Каждый из этих вариантов может создаваться, как «шумно» - когда противник видит в «Блогах Яндекса» (а точнее в RSS-потоках) момент создания блога, так и скрытно – когда противник не видит этих блогов вплоть до момента появления их в основном индексе поисковых машин.

Конкурентная разведка, помимо обеспечения выполнения своих основных задач, может использовать боевые блоги в белом пиаре своей компании или ее сотрудников, в партизанском маркетинге и при противодействии черному пиару противника.

ВНИМАНИЕ: хочу сразу предупредить особо «креативных» читателей этой статьи, что использование боевых блогов для черного пиара в наступательных целях бессмысленно.
Боевые блоги, в силу особенностей современного Интернета эпохи Web 2.0 – сугубо оборонительное оружие, подобное стратегичесикм силам ядерного сдерживания.
Поясню это словами известного политтехнолога Александра Кузина: "Использование боевых блогов целесообразно только в качестве оборонительного оружия и для нанесения "ударов возмездия" по агрессору, основываясь на контенте, форме, видах и типах атак нападающей стороны. Не пытайтесь использовать боевые блоги в качестве оружия "начала войны" по вашей инициативе. Дело не в морали и этике, а в технических деталях: Боевые блоги в качестве наступательного оружия малопригодны и могут нанести стороне, развязавшей конфликт гораздо больше вреда, чем пользы".

Таким образом, можно констатировать, что конкурентная разведка с появлением блогов получила в свое распоряжение мощный инструмент информационной войны.

Инструмент, потенциал которого еще предстоит полностью раскрыть, но который уже сегодня переворачивает многие представления об информационной войне, еще недавно считавшиеся незыблемыми.



Участник Форума бизнес-разведчиков Константин Ильин дал очень интересные и ценные, на мой взгляд, дополнения к статье. Я, с его разрешения, привожу их ниже.

Таким образом, блоги можно считать едва ли не идеальным инструментом для целей конкурентной разведки. Тем более, что создание блога бесплатно и он полностью подконтролен своему владельцу.

В этом, конечно, сила блога, но в этом его и слабость – в априорной тенденциозности. Объясню свою позицию.

Мы исходим из предпосылки, что КР ориентируется в своей деятельности в основном на аудиторию думающую, серферы не являются ее целевой аудиторией, хотя и способны помочь в распространении нужной информации, как собаки разносят на своей шерсти семена репейника.

Думающая часть инет-пользователей прекрасно осведомлена о сильных и слабых сторонах блогов, принципах их рождения, функционирования и почивания в бозе. То есть тенденциозность и личностная направленность блогов в целом для них не секрет, и в оценке информации эта категория пользователей подсознательно пропускает через мощный скептический фильтр.

Это надо учитывать при разработке стратегии блог-атаки.

Кроме того, следует помнить о такой аудитории, как «вечно подозревающие» и «рэволюционеры», которые везде видят происки и заговоры. Эти деятели своим скепсисом и заговороманией способны испортить любое начинание.



1. Блог-«легенда»

Задача такого блога – подтвердить «легенду» реального человека или виртуального персонажа. Такой блог содержит ту информацию, которая соответствует выбранной легенде. Этим и определяется количество сообщений в блоге, их содержание и даты. Сообщения, размещенные «задним числом», не отобразятся в «Блогах Яндекса», поэтому их размещение останется незамеченным противником.

По поводу дат – безусловно.

Но в самом блоге можно разместить свежие ссылки в тексте (в виде цитат и т.п.) на более «старую» информацию (например, с других блогов), таким образом в «Блогах Яндекса» можно отобразить любую легенду с любыми датами.

В общем – широкое поле для фантазий.




2. Блоги-«аэростаты»

К характеристике данных блогов я бы добавил, что
их основная задача – не дать потенциальному потребителю информации прорваться за выставленные нами «кордоны»,
а в идеале – максимально отсечь от защищаемой (или от вредоносной) информации.




4. Блог-«торпеда»

...

Противник, вставший на путь борьбы с «торпедами», будет лишь бесполезно тратить силы, время и деньги, участвуя в заведомо проигрышной для себя гонке.

Однако, есть хорошая защита от этого безобразия – из арсенала политтехнологов. Уверен, что Вы просто в силу каких-либо причин случайно упустили ее из виду.

Я веду речь о блогах-обманках, то есть практически аналогичные блоги-торпеды, но свои, которые доводят критическую ситуацию до абсурда.
Иначе – нивелирование ситуации путем перекармливания негативом потенциальных потребителей, с целью вызвать отторжение. Политтехнологи еще называют это посадкой леса.



Что обязательно добавил бы, так это атакующий блог.

Он, безусловно, имеет место быть, ведь тот же блог-торпеда, не что иное, как разновидность атакующего блога.

Что касается «обратки» для инициатора атаки, то это вопрос более чем спорный.

Навскидку приведу ряд ситуаций, когда инициатор попросту не вычисляется.

Фирма «А» ведет регионе несколько бизнесов – недвижимость, лизинг автотранспорта, деревообработка, ну и, допустим, мелкая розница. В каждой нише у нее свои конкуренты – скажем по пять-шесть.

Вариант первый. Конкурент хочет расшириться за счет позиций фирмы «А». Что он делает? Правильно. Провоцирует «блог-разборки» по смежной линии. В случае удачи, в разборки будут втянуты все крупные предприятия отрасли, а наш инициатор сумеет потеснить фирму «А» на своем поле, использовав, так сказать естественное преимущество.

Вариант второй. Иногородний конкурент. Тут вообще – простор для творчества. Можно запустить первый вариант, а чуть позже пустить слушок, что «разборки» спровоцировал «смежник». Выигрыши могут быть колоссальные.

Третий, самый тупой, но не менее действенный вариант. Открытая блог-атака от фирмы-однодневки.

В целом, я согласен с коллегами, что далеко не факт, что «ответка» вообще последует, а тем паче «ответ по площадям». Особенно в региональном бизнесе, где все друг с другом настолько тесно связаны, что массированный ответ по площадям может стать «лебединой песней» для его инициатора.

В общем, атакующий блог – это объективная реальность, при профессиональном подходе дающая очень хороший эффект.





Что добавил бы еще в целом по материалу.

Основная задача конкурентной разведки– получить необходимую информацию и исказить информационное поле до требуемых параметров. Отсюда и исходим.

Переворачивание представлений об информационной войне - пожалуй нет, а вот повышение эффективности использования имеющихся инструментов – однозначно да.

Повышается мобильность, анонимность и подставляемость.

В связи с этим я бы рассмотрел еще следующие разновидности

– блог-подстава, блог-завалинка, блог-провокатор, блог-ловушка, блог-дискуссия.

Ну и без блога-шпиона нам так же не обойтись.




Статьи на похожие темы
Взаимодействие Конкурентной разведки и PR-службы предприятия. Евгений Ющук


Корпоративный блог: взгляд на «теневую сторону Луны». Евгений Ющук, Александр Кузин

Корпоративный блог – «аптечка первой помощи» в кризисной ситуации. Александр Кузин, Евгений Ющук

Корпоративный блог – новый инструмент политических коммуникаций. Александр Кузин, Евгений Ющук

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Вс Май 01, 2011 8:41 pm    Заголовок сообщения: Ответить с цитатой

Сайт знакомств с Анкой Чапмен
gleb_324
March 7th, 11:24

http://gleb-324.livejournal.com/31470.html
Цитата:

Как оценить собственное творчество? Причем объективно, в количественных показателях. Ну, например, признание режима мне бы польстило. Как это сделать? Проще простого. Попробуем погуглить (Google)

"Небольшая государственная измена" (с кавычками, ознчающими целую фразу, а не только слова) Выскакивает 4-5 ссылок.Попробуем Yahoo или Bing – примерно такие же результаты.

Пробуем Яндекс, Рамблер или Mail.ru. Выдается 0 ссылок, при том что ресурс русскоязычный и подобный поиск должен дать намного больше ссылок.

Может просто им запрещено искать "государственная измена"?
Ничего подобного. "государственная измена" сразу дает 14 тыс сайтов.

Именно уникальное словосочетание с моего ЖЖ "Небольшая государственная измена" запрещена к поиску. Может статья недостаточно долго висела чтобы ее могли бы обработать поисковые движки?

Тогда ставим еще один эксперимент. Берем с ЖЖ Навального уникальное и свежее (1 день) словосочетание "Финальная битва между добром и нейтралитетом". Яндекс находит моментально.

Может просто ЖЖ Навального слишком знаменит чтобы его можно было банить? Хорошо, проведем тогда еще один эксперимент.

Возьмем нейтральный журнальчик, Щеглова, для примера, и возьмет свежий заголовок (уникальное словосочетание) "Экономический цикл в исполнении хора кризисологов". Яндекс и тут не сплоховал. Заголовки и фразы со всех ЖЖ проиндексированы, причем проиндексированы очень оперативно, в течение нескольких часов.

Проверил насчет индексации даже задрипанных (но нейтральных) ЖЖ, куда почти никто не ходит. В яндексе все ссылки.

Последний эксперимент вносит окончательную ясность в то, что читают ли мой ЖЖ функционеры режима, и второе – ЖЖ Навального режим не банит ни с какого боку. Навальный это запасной аэродром когда дела с Медвепутами пойдут не по плану.

Короче, мой журнальчик режим мониторит. Перепрограммирование поисковых движков - это уже ушки ФСБ торчат.

Почему тогда не грохнут? Может еще и грохнут. Только тут может быть и другое. Судя по тому что у нас с режимом интерес взаимный, то ведь им тоже должно быть интересно когда именно нужно бросать свои Бентли и нестись с кошолками к самолетам. Где это они узнают? Не у Павловского же с Кургиняном такие вещи спрашивать, ведь обманут стервецы, да и не знают они толком, это не длинные и путанные телеинтервью давать. К тому же момент начала массовой благотворительности в пользу американских детей тоже нужно не проворонить.

Хе-Хе, мой журнальчик по факту стал документиком для закрытого пользования. На него навесили гриф «Почти совершенно секретно» , осталось только Анку Чапман поставить на страже.
************************

Еще раз для тупых, после прочтения комментов

Мой ЖЖ индексируется обычно в течение пары часов и я это всегда проверял для подобных случаев. На Майл.ру дольше.

Этот последний пост проиндексировался за 15 мин.

Пост "Небольшая государственная измена" не проиндексировался синхронно на всех 3х движках больше чем за неделю. (Майл.ру, Рамблер и Яндекс).

Перед тем как поместить этот пост я поросил проверить моих читателей наличие поста на яндексе. Первые два не вернули результата, а третьему поиск вернул мой ЖЖ. То есть пост стал просматриваться во время этой проверки.

Теперь если кто немного знаком с математикой скажет какова вероятность самопроизвольных событий на всех трех движках одновременно?

31 comments




Диагноз товарища Саахова подтвердился
gleb_324
March 8th, 12:57
http://gleb-324.livejournal.com/31564.html
Цитата:
Продолжим наши исследования
Итак вчерашний пост пролил некоторый свет на контингент моих читателей и их оценку моей последней статьи.

Паранойя

Тут в основном два вида постов

1 Никакой цензуры на интернете нет. У Йцу Кена паранойя.

Никаким другим способом интерпретировать пост Некто про крокодила Гену не получается. Персонажи вроде этого Некто никогда и ни с чем у меня не ассоциировались ввиду их обыкновенной неспособности соединить факты в последовательность событий.

2 Тоже паранойя, но другого типа

Основные доводы таковы – да, типа цензура есть, но ты ЙК слишком мелок для того чтобы ее включать для тебя лично. События описанные мной при этом никак особо не объясняются. Пишущий забывает факт того, что все большие, так назыаваемые оппозиционные, ресурсы режимом созданы и им же контролируются. Если почитаете Пионера с его хунтами, обкомами и еврейским засилием, то невольно возникает чувство сюрреальности происходящего, однако российские поисковые движки исправно индексируют враждебный режиму контент. Неужели режим будет забанивать в поисковых движках то, что было создано им самим? Зачем тогда создавать? Совершенно очевидно, что забаниваться должны сайты, режиму не подконтрольные и соответсвенно маленькие. Большие контролируются модераторами, а не цензурой поисковых движков.

Все явления, такие как внешнее управление Россией, обкомы, участие спецслужб в развале СССР в массовом сознании являются точно такой же паранойей потому, что основная линия всей официальной пропаганды - это все происходит само собой или только по экономическим причинам у нас на глазах. То, что мы не видим - не существует и классифицируется как больная конспирология.

Где же мои традиционные читатели?

Если просмотреть кто именно оставил реплики на последнюю статью, то статистика этих постов подводит нас к довольно банальной мысли – мои обычные завсегдатаи своих комментов не оставили, ни один, видимо ,параноидальная версия их не очень удовлетворила. Оставили несколько анонимов или мои очень редкие гости. Это совсем не призыв к ним выходить из окопов, а лишь констатация факта что они восприняли мою статью достаточно серьезно.

Черная дыра режима

Как функционирует режим? Что мы о нем знаем? Как узнать?

Вообще знание приходит к нам прямо или опосредственно. Что мы знаем о черной дыре во вселенной? Из нее информация к нам не поступает. Однако мы можем получить некоторые характеристики ее путем наблюдения гравитационного взаимодействия со звездой. Точно также и с режимом, никто оттуда не пришлет мне письмо с описанием того, как режим работает, в чем его приоритеты. Однако режим живет, он взаимодействует со средой, в том числе и моим ЖЖ. Факт взаимодействия (забанивания) с моим ЖЖ я считаю доказанным. Этот фактик, небольшой, но все же добавил еще одну крупицу в мою модель режима.

Нечеткости логических построений

Если отбросить просто идиотские реплики Некто или Мастера, а посмотреть ,скажем, на чуть более осмысленный пост, то можно сразу увидеть разрывы в логике

«Ничего режим не уважает» – тут может быть только - либо банит и уважает (боится), потому , что зачем тогда банить, либо не банит и не уважает, соответственно факты, изложенные ЙК попадают автоматически в категорию паранойи. Никакого заслуживающего внимания альтернативного объяснения фактам пропажи моего поста с поисковых движков я не нашел в постах пишущих.

Глубокие сентеции про то, что будет Жопа тоже никому здесь не интересны, это уже входит в набор самоочевидных фактов, по крайней мере у меня на ЖЖ. Весь фокус только в точной дате и промежуточных фазах это самой жопы, а не ее наличие.

Моральная сторона режима меня вообще не интересует ввиду простого отсутствия предмета и бесперспективности для составления прогнозов. По этой же причине я никогда режим не ругаю, я его прогнозирую. Я ставлю диагноз болезни, а не пытаюсь сожительствовать с покойником. Это, надеюсь, понятно?

Большая просьба к 1master и nekto_s_k на моем сайте больше никогда не появляться ввиду полной бесполезности.

Другим также советую пересмотреть свои мотивы писания на моем ЖЖ. Мой ЖЖ - это элитный интеллектуальный клуб, чтобы здесь писать нужно иметь все-же значительную подготовку, пустую болтовню я могу терпеть из вежливости, но последнее время это меня уже начинает тяготить. Все, кто хотят здесь писать должны офомлять свои мысли в виде утверждения с фактами или вопроса. Пустопорожний поток сознания здесь не приветствуется.

ЗЫ: Похоже, начинаю понимать как эта система работает. Пока копался в этом мимоходом обнаружил еще подцензурные ЖЖ. Щупальца кровавой гэбни тянутся, оказывается, не только к ЙК... Так, заканчиваю, санитары идут...

27 comments


Цитата:
neuromir_tv
2011-03-08 10:56 am (UTC)

http://gleb-324.livejournal.com/31564.html?thread=923724#t923724
Есть у меня соображения, что к движку Яндекса прикручен семантический анализатор, типа Датамайнинг, кибераналитик и т.п.. Настроен он на негативный смысл в отношении власти, ЕР, и ряда высших должностных лиц, а так же настроен на обсуждение технологии цензурирования, после чего срабатывает сигнал/флаг и прибегают бригадники.
Вообще системы типа "кибераналитик-антитеррор" давно на вооружении сс, вполне вероятно, что сейчас запустили движок "кибераналитик-антиэкстремизм", я не знаю этого на верняка, но знаю людей, которые этим занимаются. И сие очень вероятно.



gleb_324
2011-03-08 12:10 pm (UTC)

Именно, я как раз об этом думал когда написал что начал понимать как это все работает. Слишком быстрая была реакция этих бригадников, это невозмоно сделать без подобной автоматизации. С этой точки зрения меня банили не потому что я ЙК, а просто по контенту. Скорее всего меня их фильтр-движок пречислил к экстремистам, ну и товарищ майор сам к монитору не подбегал.


Цитата:
Несколько замечаний
(Anonymous)
2011-03-08 05:32 pm (UTC)

http://gleb-324.livejournal.com/31564.html?thread=925772#t925772
Здравствуйте, Глеб.

1. Касательно вашего пожелания читателям о наличии в их постах хотя бы небольшого анализа. Предложение это конечно здравое, но дело в том, что анализировать то по сути нечего. В глобальном смысле вы уже сложили 3+2 и всё вывели формулу "российской" простите за каламбур "государственности" и добавить тут что-либо трудно. Касательно же частностей, то бишь анализа текущих событий, то тут во-первых нужно тратить на это определенное время, а во-вторых - общей картины это не изменит, следовательно не имеет смысла. Разве чтобы свой литературный талант показать.
2. Касательно контроля вашего ЖЖ со стороны спецслужб. На мой личный взгляд это имеет место быть, но вряд ли за этим последует что-либо большее. Так, например, фактически один в один ваши мысли были опубликованы в "Военном обозрении" в статье "Последняя миссия РФ - Умереть за Запад"
http://topwar.ru/3575-poslednyaya-missiya-rf-umeret-za-zapad.html
Если уж там печатают в открытую, то что уж по ЖЖ говорить...
3. Тем не менее, во избежание всякого, рекомендую создать вам свой i2p сервис, что бы уж надежно застраховаться от нежелательного внимания.




Re: Несколько замечаний
gleb_324
2011-03-09 09:17 am (UTC)

"Касательно же частностей, то бишь анализа текущих событий, то тут во-первых нужно тратить на это определенное время, а во-вторых - общей картины это не изменит, следовательно не имеет смысла. Разве что свой литературный талант показать."

Имеет смысл и очень значительный. Чем ближе к часу Ч, тем информация о времени часа Ч ценнее. Простой пример. Сколько бы оператор в зале Чернобыльской АЭС дал за информацию о взрыве? Скажем за 3 года до события, за час до события и за 5 минут до события?
Ценность информации о времения события при приближении к событию экспоненциально возрастает, доходя в пределе до бесконечности.
Так что здесь дело не в литературном таланте.

Насчет моих мыслей в военном обозрении - так кроме мыслей, которые были опубликованы в обозрении у меня есть еще и другие, которые ни в какие обозрения ни при каких обстоятельствах не попадут.

Спасибо за совет.

Цитата:
Все нормально, Глеб
(Anonymous)
2011-03-09 11:47 am (UTC)

http://gleb-324.livejournal.com/31564.html?thread=928844#t928844
"...Вам поставили "отл".
ГОРДИТЕСЬ!..." Из вот отсюдова: http://gleb-324.livejournal.com/23833.html ,
Ваш ЖЖ, июль 2010г.
(Помните "Краткий курс паразитологии" и последующие дебаты о том, что "это никому неинтересно"?). Глеб внезапно заскучал, а теперь вдруг выяснилось, что это все интересно, очень даже интересно)))
Внимательно прочитал Ваши последние заметки. Решил отметиться, т.к. ВСЕ достаточно активные завсегдатаи Вашего ресурса думаю давно пересчитаны и классифицированы кем надо, тем более, что они не представляют явной угрозы...
Вероятно, Вы правы в том, что оказываете бесплатные услуги по анализу и прогнозированию ситуации, причем без политической составляющей.
Поэтому считаю, что тут без участия "человеческого фактора" не обошлось, вряд ли только робот "фильтровал базар".
Подозреваю также, что в статье "Небольшая гос. измена" Вы проявили какую-то важную деталь, какой-то ключ, что и повлияло на дальнейшее.
Пишите, Глеб, у Вас большая и достаточно постоянная аудитория, которая также пытаетя понять, что происходит и КАК будут развиваться дальнейшие события.
V_de_G

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Вс Май 01, 2011 8:52 pm    Заголовок сообщения: Ответить с цитатой

ЕщеOdinЭксперимент
gleb_324
March 21st, 15:46
http://gleb-324.livejournal.com/32648.html
Цитата:
Я тут написал бессмысленный текстик. Посмотрим как на него будут реагировать поисковые движки (или товарищ майор)

продали медведев второй срок коррупция государственная измена масоны Россия русский национализм США империя взятки Путин 40 миллиардов продали уран элита возродить абрамович восстановить армия честь ракеты Ленин СССР образование обучение медицина челси безработица вкусно куба китай ВВП Мендель продали коррупция государственная измена масоны русский национализм США империя взятки Путин сионисткий заговор 40 миллиардов Россия пожары гробы говно продали Мендель возродить восстановить армия честь ракеты Ленин СССР образование обучение медицина безработица куба китай ВВП жвачка распад россии продали коррупция государственная измена сионисткий заговор масоны русский национализм США империя взятки Путин 40 миллиардов продали возродить восстановить армия честь ракеты Ленин СССР образование обучение наука умерла медицина безработица куба китай ВВП законы беспредел зона вымирать пожары гробы заговор говно продали коррупция государственная измена сионисткий заговор масоны русский национализм США империя взятки Путин 40 миллиардов кавказцы кгб казна золото украдено продали возродить восстановить армия честь ракеты Ленин СССР образование обучение медицина безработица куба китай ВВП организовываться собираться конспирация не позволим требуем выборы фальсификация сталин война бойкот партизаны приморье отстреливать горбачев

( 15 comments)

Цитата:
gleb_324
2011-03-21 12:57 pm (UTC)

гугл уже отиндексировал. 5 мин.

Цитата:
gleb_324
2011-03-21 01:31 pm (UTC)

вообще-то уже 40 минут прошло, а индексации все нет. Обычно и 15 мин хватает. Если в течение часа не проиндексируется, то экперимент можно считать (с достаточной долей вероятности) удавшивмся.
А насчет не там ищете, то не хотите ли сказать что движки вовсе без цензуры работают? И насчет глюка, вы невнимательно читали мой текст, там синхронно на 3-х движках

Цитата:
gleb_324
2011-03-21 01:48 pm (UTC)

прошел час. индексации нет. Ни на одном из 3-х движков.



(Anonymous)
2011-03-21 02:36 pm (UTC)

Обратите внимание

http://yandex.ru/yandsearch?text=%22%E5%F9%E5odin%FD%EA%F1%EF%E5%F0%E8%EC%E5%ED%F2%22

http://yandex.ru/yandsearch?text=site%3Agleb-324.livejournal.com+%22%E5%F9%E5odin%FD%EA%F1%EF%E5%F0%E8%EC%E5%ED%F2%22

То есть можем зафиксировать что был сам факт индексации, а вот в "простой" выдаче прячется



(Anonymous)
2011-03-21 03:33 pm (UTC)

Действительно. Видимо пост будет прятаться в "простой выдаче" пока "товарищ майор" его не проверит.

Цитата:
(Anonymous)
2011-03-21 05:43 pm (UTC)

Появился ваш пост при при простом поиске - проверка "товарищем майором" пройдена. А ранее как было обнаружено, был индексирован, но не выдавался.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Вс Май 01, 2011 8:58 pm    Заголовок сообщения: Ответить с цитатой

(no subject)
gleb_324
March 21st, 11:48
http://gleb-324.livejournal.com/32648.html
Цитата:
Я обещал поделиться моими находками как работает российская интернет цензура.
Ну в общем цензура - это эшелонированная конструкция, состоящая из нескольких, скажем так, ярусов. К тому же российская интернет-цензура это даже не совсем российская штука, она может быть функциональна только в кооперации с международными ресурсами.



Первичная цензура – это разрешение на открытие сайта в домене РУ. Хотя открыть можно где угодно, но обычно легче это сделать в России, однако ничего серьезного, враждебного режиму, естественно, открыть не удастся. Просто придут с обыском и закруют нах.. Еще пришьют экстремистскую статью и до свидания..

Цензура модераторов.

Все без исключения значительные интернет ресурсы контролируются режимом, соответственно там сидят модераторы на зарплате и на особо важных есть еще и массовка, которая заваливает любую ненужную власти дискуссию. С массовкой ,я думаю, что они сидят по домам, а когда поступает сигнал, начинают атаковать этой виртуальной стаей, думаю, что они не закреплены за конкретным сайтом.

Штат провокаторов.

Популярные интернет ресурсы содержат провокаторов на зарплате. Характерный пример это сайт Хазина. Пишу про сайт Хазина только для примера потому, что хорошо знаком с его работой. Сам Хазин тоже на кормлении у режима, но это у него, видимо, не основной заработок. К тому же он денег от режима может и вообще не получает, режим дает ему возможность зарабатывать на стороне обеспечивая популярность, продвигает его на телевидении. Провокаторов на зарплате там по крайней мере два или три. Основной это Московский, шлет свои посты 24 часа в сутки из года в год. Думаю, это команда. Есть еще один – Рыков. Довольно странный персонаж там Илья Муромец, антисемит, ругает евреев через слово, грамотный, но при этом никогда не скажет слова поперек еврею Хазину, сам Хазин тоже вступает с ним в дискуссии. Почему? Думаю, Хазин имеет с ним особые отношения, возможно Муромец ему нужен как клоун в перерывах, ведь сам сайт без Муромца уже полный отстой. Там остались одни дебилы и провокаторы.

Рейтинги

Манипулирование рейтингами блогов. Эта штука хорошо известна, нет необходимости объяснять больше.

Международная кооперация.

Зачем Гугл вырезал из своих карт газпромовские дворцы? Что дало это Гуглу понятно – деньги, а вот что дало это Газпрому? Избежит воздушного десанта пришельцев?

ЖЖ

СУП купил ЖЖ за границей, оригинально ЖЖ это не русский сегмент. Тут особо и рассуждать не о чем. ФСБ купило ЖЖ для контроля, при этом здесь просматривается нарушение местного (там где ЖЖ зарегистрирован) законодательства, ведь для подсматривания купили . Думаю, деятельность СУПа идет с прямым нарушением вот этой декларации

http://www.livejournal.com/legal/privacy.bml

Однако логично предположить, что подобные нарушения не являются секретом для западных надзорных служб, это или их не касается или устраивает по тем или иным причинам. ЖЖ был куплен примерно за 30 миллионов долларов дружбаном Путина Мамутом.

Существуют ли настоящие оппозиционные российскому режиму сайты за пределами России?

Нет, не существуют. Единственный более или менее оппозиционный сайт это Кавказ-центр. Но он вообще непонятно кем финансируется, похоже, совместно ЦРУ и клановыми группировками в России.


Еще есть сбежавшая на Запад научная парт-номенклатура или творческя парт-номенклатура. Лопатников , Лебедев (http://www.lebed.com/ ) , Кожевникова (http://www.lebed.com/2011/art5819.htm) и др. Эти немного критикуют режим – Лебедев и хвалят новую родину. Лопатникова описыать нет необходимости, Вы все знакомы, я думаю, с этим полусвихнувшимся старым мудаком. На Западе никакой серьезной оппозиции режиму в России нет в первую очередь потому, что сам Запад этого не хочет и не позволит ей развиться. Новый Ленин может возникнуть только в Китае, однако не возникнет.

Есть еще настоящая оппозиция, вроде

http://oldfisher-mk.livejournal.com/ , но это совсем мелочь в стакане воды.

Поисковые движки.

В связи с моим случаем стало более и менне понятно как эти движки цензурят.
Я учитываю несколько факторов: Синхронность отклика всех российских поисковых движков на входное воздействие и сам ответ на входной контент.

Как это было. В двух словах. Я обычно проверяю индексацию моих постов российскими движками и другими. Зачем? Чтобы понять насколько я интересен с точки зрения враждебности моих статей в оценке режима. Я ведь исследую режим. Помните у Лема в Солярисе, океан жестко облучили рентгеном для получения ответа на воздействие и исследование этого ответа. Для меня режим это такой же океан, который имеет внутреннюю неизвестную структуру. Так что обнаружение недавних аномалий не было простой случайностью. Я это ожидал. Некоторое время назад я уже заметил такую же аномалию, но решил проверять дальше. Так что это не первый случай. Солярис начинает со мной взаимодействовать.

Когда попросил читателей проверить на предмет поиска движком, то пост стал видимым во время проверки, то есть в течении 5-10 мин и притом синхронно на двух движках, яндексе и майл.ру. На Рамблере не проверял. Двух для статистики достаточно. Потом исчезал и появлялся пару раз, пока не появился окончательно. Итак, что имеем. Случайность отпадает, 8 дней пост был невидимым на всех трех движках, потом появился синхронно на двух (или трех, не знаю) и как раз в момент проверки, при том что обычно пост индексируется на моем сайте меньше чем за 2 часа. (обычно менее часа)

Если всю мою писанину отслеживает робот, то забанивание произошло по контенту и с этим вопросов нет. А вот с разбаниванием возникает уйма воросов. Если у цензуры была задача скрыть факт цензуры, то робот, по идее, должен реагировать на попытки проверить наличие цензуры, но для этого он должен понимать сущность этой проверки как человек. Ведь никаких ключевых слов (ну вроде Цензура, Режим итд) в моей просьбе проверить виден ли пост, не содержалось, а сам пост я специально вообще не озаглавил для чистоты эксперимента. Я просто попросил поискать фразу с кавычками. Насколько мне известно, ни одна система искусственного интеллекта не может понимать смысл предложений, особенно если он неявный.

Возможна, конечно, еще реакция на запрещенную фразу плюс слово «Яндекс», но опять -таки нужно после этого разбудить тов. лейтенанта. Пока могу предложить такую схему – сайт или пост забанивается по содержанию (контенту. ключевые слова или фразы в определенном порядке и составе), а потом к забаненым сайтам с наивысшим рейтингом прикрепляется товарищ майор, который и работает вместе с роботом.

Все ясно как это было сделано, однако теперь остается еще один вопрос – а зачем меня вообще разбанили? Причем в такой явной форме. Ведь цензура на инете это ведь не секрет Полишинеля.

39 comments

Цитата:
Вопрос по оппозиционным сайтам
(Anonymous)
2011-03-21 10:13 am (UTC)

http://gleb-324.livejournal.com/32648.html?thread=961928#t961928
Глеб, а как Вы воспринимаете сайт Беркема? И особенно его литературное творчество, а именно "Мародер" и "Каратель"?

Да, и ответьте, по-возможности, на мои вопросы в предыдущем посте.

С уважением,
Замкадовец.




Re: Вопрос по оппозиционным сайтам
gleb_324
2011-03-21 10:18 am (UTC)

Сайт Беркема под колпаком, как и его владелец. Тут уже была очень горячая дискуссия с самим Беркемом. В прошлом году, можете полистать материалы моего ЖЖ.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пн Май 02, 2011 8:57 pm    Заголовок сообщения: Ответить с цитатой

Явным признаком гостей, просматривающих Ваш траффик является замедление скорости работы в сети - вплоть до невозможности отправки сообщений(выдаёт - сайт недоступен).

Но при входе на Ваш сайт через анонимайзер или с незнакомого ай-пи - всё работает, причём во много раз быстрее.
Smile
_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Пн Май 09, 2011 6:57 am    Заголовок сообщения: Ответить с цитатой

chispa1707
July 25th, 2010
http://chispa1707.livejournal.com/29562.html
Цитата:
Как выяснилось, за пределами РФ Яндекс резко теряет память.
***
8 июля 2010 года, будучи в Стамбуле, я обнаружил, что Yandex.ru не знает доменного имени моего сайта livehistory.ru. Забитое в поисковую строку имя раз за разом приводило к тому же результату: Yandex.ru отвечал, что такого не существует.
***
Тогда в надежде выйти на свой сайт окольным путем, я забил в поисковую строку Яндекса свой ник chispa1707. Результат оказался тот же, хотя этот ник использовался примерно на десятке форумов, и в России Yandex.ru его отлично находит. Могучей поисковой системе, едва она вышла за пределы РФ, словно отшибло память.
***
Тогда я нашел свой ник на Google.com, прошел в свой ЖЖ и дотошно проверил, только ли мой ник неизвестен Яндексу за пределами РФ. Оказалось не только. Из 55 моих фрэндов (сегодня их чуть больше)
000_001_111, a_sult_h, alexey_zharikov, amigooo, artdoyarenko, asterrot, bachelor71, balanseeker, baler_m, barnak, beloknizhnik, bskamalov, ckotinko, clandike, ctapukan, darkhorse0310, derzkiy_patsan, drugoi_lebedev, dt_e, galkovsky, germila, ggkshatriya, gklimov, govorilkin, homo_valerius, hvac, i_grappa, ishkur777, istinata, ita2010com, ivan_ghandhi, journal_neo_ru, khaz_nyakan, lc, lol4egg, max_a_lebedev, mefi100, mineralissimus, monsenor, mr_anonymus, mymoon_leo, naphsh, nekto_s_k, nezvanov, pan_drevnachek, paramirus, pioneer_lj, pisecdzi, ramil_bulgari, ravshir, sbochkarev, scaliger99, taii_liira, travinv, u_b_2006, uma_palata, uri_mig, w_ran
Яндекс знал только 51. Когда я забивал в поисковую строку Яндекса ники давно тусующихся в интернете вот этих моих фрэндов (ckotinko, homo_valerius, mineralissimus, ramil_bulgari), Яндекс отвечал, что таких не существует.
***
Более того, у Яндекса отказывала не только память... Работая на два окна, я копировал ники фрэндов (Ctrl + C) у себя в ЖЖ и вставлял их в (Сtrl + V) в поисковую строку Яндекса. И выяснилось, что ники этих моих четырех фрэндов НЕ ВСТАВЛЯЮТСЯ в поисковую строку.
Если я копировал только ник, то получал пустоту.
Если я копировал ник и запятую, то получал запятую,
А если я копировал, например, вот так ramil_bulgari, ravshir, sbochkarev, то получал запятую и то, что следует после "запрещенного" ника - , ravshir, sbochkarev
***
Три дня я упрямо повторял эксперимент, пытаясь поверить, что это не глюк, и на четвертый все наконец-то изменилось. Яндекс научился находить три ника из четырех. Один мой фрэнд так и остался Яндексу неизвестен. По крайней мере на территории Республики Турция.
***
Такое могло бы быть, если бы в интернете существовала четкая государственная граница - как и на земле, с досмотром и периодическими "мерами".
***
Надеюсь, что этот казус происходит только с моими фрэндами и только на территории Турции. Есть ведь и другие страны, и другие ники

Цитата:
chispa1707
2010-07-28 05:36 pm (UTC)

Более всего меня смутил ИЗБИРАТЕЛЬНЫЙ и ОЧЕНЬ СТАБИЛЬНЫЙ отказ поисковой строки Яндекса принимать в себя конкретное уникальное сочетание букв.
ckotinko
homo_valerius
mineralissimus
ramil_bulgari
Именно на них (из 55 таких же уникальных) сочетание клавиш Ctrl + V не срабатывало трое суток подряд - с 8 по 12 июля 2010 г.
***
Еще раз подчеркну: глюк был
- ОЧЕНЬ СТАБИЛЬНЫЙ;
- ИЗБИРАТЕЛЬНЫЙ.
***
Яндекс отказывался:
- принимать эти ники в поисковую строку;
- при забивке вручную сообщал, что такого не существует.
***
По-моему, это не гэбня.
По-моему это (нецензурно)



На самом деле
mister1st
2010-07-28 10:14 pm (UTC)

из Украины я вижу, что или поиском манипулируют вручную - например поиск по репликам отдельных пользователей отключают в выходные или другие дни, или там есть база кого и когда отключать. То есть я читаю комментарии конкретных пользователей в разных журналах, а в поиск они не попадают или попадают выборочно, хотя соседние комментарии индексируются.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Чт Июл 28, 2011 3:59 pm    Заголовок сообщения: Ответить с цитатой

Открой то, что сейчас не открывается,
или Как пользоваться кэшем Google?
http://netler.ru/ikt/cache-google.htm
Цитата:
<...>
Примечания

1. В сохраненной в кэше Google копии веб-страницы условия поиска выделяются цветом, чтобы было проще оценить релевантность страницы.

2. Ссылка Сохраненная копия не показывается для сайтов, которые еще не были проиндексированы, а также для тех, чьи владельцы запросили Google не сохранять в кэше содержимое их сайтов.

3. Вы можете воспользоваться кэшем Google напрямую, введя в адресную строку браузера

http://209.85.135.132/search?q=cache:http://адрес_ресурса/.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Чт Июл 28, 2011 4:01 pm    Заголовок сообщения: Ответить с цитатой

СКРЫТЫЕ ВОЗМОЖНОСТИ GOOGLE
http://www.security.ase.md/publ/ru/pubru82/
Цитата:
Колесник Алла, Департамент информатики Молдавской Экономической Академии

За последние несколько лет появилось множество статей, которые предупреждают о том, что злоумышленники используют поисковую систему google для получения доступа к файлам, к которым, по идее, они доступа иметь не должны.

Базовая поисковая техника

Поскольку интерфейс Google совсем прост в использовании, сфокусируемся на некоторых доступных операторах поисковых запросов:
использование знака (+) для поиска наиболее общих слов, применение знака (-) для исключения термина из поиска (пробелы между знаками не допускаются)
чтобы найти фразу,простопомещаютеёвкавычки<>
знак <*> означает любое слово.

Операторы для более продвинутого поиска помогают поисковые результаты. Такие операторы имеют следующий синтаксис: (в этом выражении также не должно быть никаких пробелов). Примеры этих операторов:
site: инструктирует Google ограничить поиск конкретным web-сайтом (доменом); название сайта (домена) указывается сразу после двоеточия и без пробела
filetype: инструкция произвести поиск только в пределах текста указываемого типа файлов. Тип файла указывается после двоеточия (точку перед расширением файла указывать не нужно).
link: производить поиск внутри гиперссылок содержащих поисковый запрос
cash: оператор демонстрирует версию страницы, когда она индексировалась Google-ом. URL страницы указывается сразу после двоеточия
intitle: производить поиск внутри названия документа
inurl: искать внутри URL документа.



Техника Google хакинга

Использование основной техники поиска вместе с операторами продвинутого поиска Google позволит осуществить сбор информации и выявить существующие в сайте. Такие действия принято называть Google-хакингом.



Карта сайта

Чтобы выявить каждую страницу на сайте, Google сканирует его, используя оператор "site:". Рассмотрим запрос такого вида: site:http://www.microsoft.com microsoft. Этот запрос выполняет поиск по слову в пределах сайта http://www.microsoft.com. Как много страниц на сервере Microsoft содержат слово ? Согласно Google - ВСЕ ! Google исследует не только содержание страниц, но также их название и URL. Слово стоит в URL каждой страницы http://www.microsoft.com. Таким образом - единственным запросом хакер может инициировать обработку каждой страницы на сайте Microsoft, проиндексированной Google. Но есть исключения из этого правила. Если ссылка на странице Microsoft указывает обратно, на IP адрес сервера Microsoft, Google кэширует эту страницу как относящуюся к IP адресу, но не к серверу http://www.microsoft.com. В этом специальном случае хакер может изменить свой запрос, заменив слово просто IP адресом веб-сервера Microsoft.



Нахождение листинга директории

Листинг директории представляет собой список файлов и директорий удаленного сервера в окне браузера. Такие листинги открывают широкие возможности для углубленного сбора информации. Как правило, такие страницы директорий имеют в Title и теле страницы выражение . Отсюда очевидно и строение запроса для поиска таких листингов - это . В результате такого запроса будут найдены тонны страниц со словом в разделе Title документа.

К сожалению - этот запрос вернет слишком большое число страниц не по теме, к примеру, страницы вида:
Index of Native American Resources on the Internet
LibDex-Worldwide index of library catalogues
Iowa State Entomology Index of Internet Resources

Исходя из названий найденных документов, очевидно, что эти страницы не соответствуют заданному хакерскому запросу и вряд ли окажутся искомыми списками директорий.

Следующие запросы обеспечат более точные результаты:
intitle:index.of "parent directory"
intitle:index.of name size

Такие запросы более точно выдадут то, что нам нужно, поскольку ориентированы не только на фразу в Title страницы, но и на ключевые слова, всегда имеющиеся в листингах директорий: , , . Очевидно, что такой запрос можно комбинировать с другими, чтобы найти определенные файлы в списках директорий.



Определение версии WEB-сервера

Точная версия программного обеспечения web сервера - это один из элементов, необходимых хакеру для успешной атаки. Если хакер непосредственно соединится с сервером, то HTTP (web) заголовки (headers) этого сервера предоставят нужную ему информацию. Однако можно получить эту информацию из кэша Google безо всякого соединения с сервером. Такой метод основан на использовании как раз списка директорий.

Всё очень просто: список файлов директории включает имя серверного софта и его версию. Грамотный web администратор может фальсифицировать эту информацию, но это часто она реальна, поэтому хакер беспрепятственно может, получив список директории (см. выше), определить версию сервера, на основе чего выбрать способ его атаки.

Как же выглядит такой запрос?.. Оказывается - просто: Как видно - он основан на содержании фразы в разделе title страницы директории и фразы , содержащейся в конце любого листинга директории. К примеру, так выглядит запрос, определяющий версию сервера aol.com: .

Также возможно определить версию веб-сервера на основании страниц по умолчанию, установленных на сервере. Чаще всего устанавливаемый веб-сервер поставляется с набором страниц по умолчанию. Имея простую тестовую страницу, администратор может связаться со своим собственным веб-сервером, чтобы удостовериться, что он установлен правильно.

На самом деле, теория очень проста. Чтобы получить интересующую вас информацию, вам нужно попробовать представить, в каких файлах эта информация может находиться, а затем просто попытаться их найти. (Например, попробуйте поискать *.xls файлы). Или же вы можете избрать более интересный подход - подумать, какой софт, установленный на атакуемой машине, предоставляет возможность выполнять нужные вам задачи, затем ввести критические/опасные файлы этого программного обеспечения в строку поиска. Примером может послужить система управления содержанием сайта (content management system). Вам нужно исследовать эту систему, выяснить, какие файлы она в себя включает, а затем воспользоваться google. Самое главное - четко поставить перед собой цель и знать, что вы хотите найти. Только после этого вы можете воспользоваться Google.

Google позволяет искать специальные типы файлов, то есть, как результат поиска, вы получаете не html-страницы (web сайты), а, например, файл Microsoft Excel. Вот что нужно ввести в строку поиска: Filetype:xls (для файлов excel) или filetype:doc для файлов Word.

Наверное, будет интереснее найти файлы *.db и *.mdb. Можно поискать и другие типы файлов. Первое, что приходит на ум - *.cfg или *.pwd, *.dat файлы и т. п. Сначала подумайте, какие файлы могут содержать ценную информацию.

Некоторые основные способы защиты от хакеров, использующих Google:
Держите свою секретную информацию подальше от Интернета. Даже если вы думаете, что вы размещаете информацию на веб-сайте временно, есть большие шансы, что вы либо забудете о ней, либо поисковая система может найти её.
Используйте приемы, указанные выше для проверки вашего сайта на наличии секретной информации или уязвимых файлов.
Примите во внимание возможность убрать ваш сайт из индекса Google. В некоторых случаях вы можете удалить отдельные страницы из индекса Google.
Internet - это сеть, к которой подключены сотни тысяч, а то и миллионов web серверов и по идее, можно получить доступ к любым данным, конечно, если они не защищены подобающим образом. Как разработчики программного обеспечения, так и конечные пользователи должны уделять больше внимания конфигурации защиты, устанавливаемой по умолчанию и политике безопасности. В конце концов, всегда найдутся люди, которые допускают ошибки, устанавливают все по умолчанию, используют плохо защищенное программное обеспечение и совсем об этом не беспокоятся или все еще верят, что ничего не произойдет, если они поместят все это в таком виде в Интернет. Но есть личности, которым нравится находить интересную информацию не для посторонних глаз. Google может вам значительно помочь в таких делах, к тому же это совсем не трудно.

_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
us998



Зарегистрирован: 05.12.2009
Сообщения: 8248
Откуда: СССР

СообщениеДобавлено: Ср Авг 17, 2011 8:10 pm    Заголовок сообщения: Ответить с цитатой

Spider Simulator
http://www.seochat.com/seo-tools/spider-simulator/

redforum.s2.bizhat.com:
http://www.seochat.com/?go=1&option=com_seotools&tool=17&url=http%3A%2F%2Fredforum.s2.bizhat.com%2F&imageverify=rs67v&timehsh=426a7458576a383d&submit=Spider



Палю тему: Google Cache Browser
Alek$ Web&ko: жизнь в WWW вт, 08/07/2008 - 13:13

http://nevkontakte.org.ru/blog/alek%24/palyu-temu-google-cache-browser
Цитата:
Речь пойдет о проекте [url=http://scb.net.ru]Google Cache Browser[/url]
Судя по всему, этот проект появился в сети совсем недавно, так как в поисковиках мне его обнаружить не удалось. Я сам узнал о нем совершенно случайно - друг за бутылочкой пива рассказал, что читал анонс этого сервиса на форуме какого-то хостинга, где девелопер обещал, что сайт вот-вот появится. Но это все лирика.

Что же на самом деле представляет собою этот сервис?
Вот что говорится на странице описания проекта:
Цитата:
Google Cache Browser - это инструмент, позволяющий легко и быстро просматривать страницы из кеша Google. Принцип действия от части похож на веб-прокси (анонимайзер): Google Cache Browser (далее GCB) загружает страницу из кеша Google и заменяет ссылки в документе так, чтобы они приводили к загрузке новых страниц из кеша снова через GCB.

Иными словами, мы можем просматривать кеш гугля в режиме обычного серфинга. Удобно Smile

Надо отметить, что сервис доступен на двух языках - русском и английском. Надо полагать, что у владельца есть далеко идущие планы на развитие сайта и бесплатный домен - это только первая ступенька лестницы. Еще одно наблюдение, за верность которого я поручиться не могу, но подозреваю, что не слишком далек от истины: В копирайте значится "Spider Cache Browser" и домен SCB.net.ru наводят на мысль, что автор собирается реализовать аналогичный сервис и для других поисковых систем.

Еще хочется отметить, что там очень грамотно, на мой взгляд, реализована система сообщения об ошибках - на каждой странице в правом верхнем углу есть ссылка на форму баг-репорта, в которой автоматом прописывается адрес проблемной страницы и надо только написать описание ошибки.
Trackback URL for this post:
http://nevkontakte.org.ru/trackback/239



Даный сервис предоставляет возможность проверить групу ссылок на наличие в кэше Google не подвергая свой IP санкциям поисковой системы распознавая его как спам-бота. Детальная информация как пользоватся сервисом описана в справочной системе.
http://gcc13.110mb.com/services.php#form
_________________
новый http://9e-maya.com/index.php?action=forum
резерв http://9e-maya.org/forum/index.php
http://www.igstab.net./
Вернуться к началу
Посмотреть профиль Отправить личное сообщение
Показать сообщения:   
Этот форум закрыт, вы не можете писать новые сообщения и редактировать старые.   Эта тема закрыта, вы не можете писать ответы и редактировать сообщения.    Список форумов Война -> Интернет и информация Часовой пояс: GMT
На страницу 1, 2  След.
Страница 1 из 2

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах


Powered by phpBB © 2001, 2002 phpBB Group
subRed style by ktauber
Web Hosting Directory

Free Web Hosting | File Hosting | Photo Gallery | Matrimonial


Powered by PhpBB.BizHat.com, setup your forum now!
For Support, visit Forums.BizHat.com