Парсинг — это законно!

Парсинг - это законно

WEB-Парсинг – это процесс сбора информации с веб-сайтов в соответствии с заданными параметрами. При этом параметры могут быть любыми – это может быть текст, это могут быть ссылки на интересующие источники, а также многое другое. По сути все, что находится в интернете, может быть подвергнуто парсингу и обработано специально для вас.

Парсинг для рунета – это уже реальность с большим количеством вариантов применения, начиная со сбора статистической информации и заканчивая проведение глубинных исследований интернета. В бытовом применении парсинг будет полезен даже студентам, которые поставив работать парсер в соответствии с заданными параметрами и уйдя спокойно заниматься другими делами, на утро получат практически всю информации из глобальной сети по искомой теме и смогут приступить, к примеру, к написанию диплома.

Так почему же в русскоязычном сегменте мировой паутины практически отсутствует информация о парсинге?

В основном это связано с тем, что большинство воспринимают парсинг, как форму хакерства. Однако это совершенно не так.

ст. 272 УК РФ предусматривает уголовную ответственность за неправомерный доступ к охраняемой законом компьютерной информации, если это деяние повлекло уничтожение, блокирование, модификацию либо копирование компьютерной информации.

Законодателем не уточнено понятие доступа к информации. Указанное понятие содержится в п. 6 ст. 2 Федерального закона от 27.07.2006 N 149-ФЗ «Об информации, информационных технологиях и о защите информации»: «доступ к информации — возможность получения информации и ее использования».

Под охраняемой законом понимается информация, для которой законом установлен специальный режим ее правовой защиты (например, государственная, служебная и коммерческая тайна, персональные данные и т.д.).
Неправомерным считается доступ к конфиденциальной информации или информации, составляющей государственную тайну, лица, не обладающего необходимыми полномочиями (без согласия собственника или его законного представителя), при условии обеспечения специальных средств ее защиты.

Другими словами, неправомерный доступ к компьютерной информации — это незаконное, либо не разрешенное собственником или иным ее законным владельцем использование возможности получения компьютерной информации. При этом под доступом понимается проникновение в ее источник с использованием средств (вещественных и интеллектуальных) компьютерной техники, позволяющее использовать полученную информацию (копировать, модифицировать, блокировать либо уничтожать ее).

И вот тут начинается самое интересное, поскольку все представленные в мировой паутине данные являются данными открытого доступа, в случае если они размещены на публичных ресурсах.

Для примера: информационное агентство РИА никогда не будет пытаться привлечь вас к ответственности за парсинг их страницы в сети интернет, поскольку вся представленная информация является публичной и размещена специально для чтения и всеобщего обозрения. Аналогичным образом ситуация будет обстоять и со всеми прочими интернет-ресурсами.

Остановимся на таком примере: нам необходимо получить сведения с сайта предположим tez-tour.ru о стоимости туров в Турцию. Для этого мы можем посетить веб-страницу туроператора, а можем применить парсер и получить всю информацию в необходимом нам виде. Кто-то скажет – это коммерческая тайна! Однако это не так.

Коммерческая тайна — режим конфиденциальности информации, позволяющий ее обладателю при существующих или возможных обстоятельствах увеличить доходы, избежать неоправданных расходов, сохранить положение на рынке товаров, работ, услуг или получить иную коммерческую выгоду.

Информация, составляющая коммерческую тайну, — сведения любого характера (производственные, технические, экономические, организационные и другие), в том числе о результатах интеллектуальной деятельности в научно-технической сфере, а также сведения о способах осуществления профессиональной деятельности, которые имеют действительную или потенциальную коммерческую ценность в силу неизвестности их третьим лицам, к которым у третьих лиц нет свободного доступа на законном основании и в отношении которых обладателем таких сведений введен режим коммерческой тайны.

Информация, составляющая коммерческую тайну, обладателем которой является другое лицо, считается полученной незаконно, если ее получение осуществлялось с умышленным преодолением принятых обладателем информации, составляющей коммерческую тайну, мер по охране конфиденциальности этой информации, а также если получающее эту информацию лицо знало или имело достаточные основания полагать, что эта информация составляет коммерческую тайну, обладателем которой является другое лицо, и что осуществляющее передачу этой информации лицо не имеет на передачу этой информации законного основания.

Таким образом, учитывая, что на web-страницах не используется какой-то специальный режим защиты данных, то соответственно данная информация не может быть отнесена к коммерческой тайне. Равно как не может быть отнесена к разряду коммерческой тайны информация, размещенная на ценниках в магазине.

Аналогичным образом ситуация состоит и со ст. 273 УК РФ – «Создание, использование и распространение вредоносных программ». Поскольку программа-парсер не взламывает никакой код, не осуществляет несанкционированного проникновения, она просто за вас осуществляет просмотр страниц и аккумулирует собранные данные в заказанный вами формат. Ни больше, ни меньше!

Однако необходимо помнить о том, что получение любой информации с целью ее дальнейшего размещения должно сопровождаться соответствующим копирайтом, поскольку зачастую размещенные сведения имеют соответствующие авторские права. Глава 70 Гражданского Кодекса Российской Федерации определяет требования к тому, что считать объектом авторских прав, а также порядок использования подобной информации.

Подводя итог всему вышеописанному, приходим к выводу, что применение парсеров на территории Российской Федерации абсолютно законно, не противоречит требованиям действующего законодательства и является отличным средством быстрого сбора информации из сети интернет.

2 Replies to “Парсинг — это законно!”

  1. Но все эти техники прекрасно обходятся, так что по сути — защиты нет. Динамические прокси, сервисы распознающие капчи индусами, и selenium с хорошо прописанным алгоритмом действий. Всё, чего можно добиться — разработка парсера будет стоить подороже, возможно кого-то это и отпугнет, но если целевой сайт — это не каталог на полторы страницы местного ооо «рога и копыта», то повышение затрат мало кого отпугивает. Вы просто себе не совсем представляете как можно блокировать парсеров. Но я вас уверяю, что любой парсинг можно остановить. Автоматический — очень просто. Неавтоматический — сложнее. Но тоже можно. Короче, было бы желание, а средства защиты есть и они работают, при этом не стоят баснословных денег.

    1. Мы в этой сфере работаем более 15 лет, думаю что у нас есть достаточно опыта 🙂 Эффективной защиты от парсинга, которая бы не затронула пользователей сайта не существует. Можно сделать парсинг ресурса более дорогим, но уверяю Вас, что единственное решение для публичных сайтов, которые не хотят, чтобы их парсили — открыть API. Парсится даже гугл, думаю у них достаточно финансовых возможностей, чтобы этому противостоять.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт защищен reCAPTCHA и применяются Политика конфиденциальности и Условия обслуживания применять.

Срок проверки reCAPTCHA истек. Перезагрузите страницу.