Как да обходим голям сайт и да извлечем данни с помощта на SEO Spider на крещящата жаба

Screaming Frog SEO Spider

В момента помагаме на няколко клиенти Пазарни миграции. Тъй като големите компании използват корпоративни решения като този, това е като паяжина, която се вплита в процеси и платформи с години ... до момента, в който компаниите дори не са наясно с всяка точка на допир.

С платформа за корпоративна маркетингова автоматизация като Marketo, формулярите са входната точка на данните в сайтовете и целевите страници. Компаниите често имат хиляди страници и стотици формуляри в своите сайтове, които трябва да бъдат идентифицирани за актуализиране.

Страхотен инструмент за това е SEO Spider на крещящата жаба... може би най-популярната платформа на пазара за обхождане, одит и извличане на данни от даден сайт. Платформата е богата на функции и предлага стотици опции за почти всяка задача, от която се нуждаете.

Крещяща жаба SEO Spider: Обхождане и извличане

Ключова характеристика на Screaming Frog SEO Spider е, че можете да извършвате персонализирани извличания въз основа на Регулярно изражение, XPath, или CSSPath специфики. Това е изключително полезно, тъй като ние искаме да обходим сайтовете на клиента и да одитираме и улавяме стойностите на MunchkinID и FormId от страниците.

С инструмента отворете Конфигурация> По избор> Извличане за да идентифицирате елементи, които искате да извлечете.

screamingfrog извличане по поръчка

Екранът за извличане позволява практически неограничено събиране на данни:

Правила за извличане на Spider Frog SEO Spider

Извличане на регулярни изрази, XPath и CSSPath

За MunchkinID идентификаторът се намира в скрипта на формуляра, който е на страницата:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

След това прилагаме a Правило за регулярни изрази за да заснемете идентификатора от скрипта, който е вмъкнат в страницата:

Regex: ["']id["']: *["'](.*?)["']

За идентификатора на формуляра данните са във входен маркер във формуляра Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Прилагаме Правило XPath за да заснемете идентификатора от формата, който е вмъкнат на страницата. Запитването XPath търси форма с вход с име на страшен, след това екстракцията запазва стойност:

XPath: //form/input[@name="formid"]/@value

Крещяща жаба SEO Spider Javascript Rendering

Друга чудесна възможност на Screaming Frog е, че не сте ограничени до HTML на страницата, можете да изобразите всеки JavaScript, който ще вмъкне формуляри във вашия сайт. В рамките на Конфигурация> Spider, можете да отидете в раздела Rendering и да активирате това.

Крещяща жаба SEO Spider Javascript Rendering

Разбира се, това отнема малко повече време за обхождане на сайта, но ще получите формуляри, които се визуализират от страна на клиента от JavaScript, както и формуляри, които са вмъкнати от страна на сървъра.

Въпреки че това е много специфично приложение, то е изключително полезно, докато работите с големи сайтове. Абсолютно ще искате да проверите къде вашите формуляри са вградени в целия сайт.

Изтеглете Screaming Frog SEO Spider

Какво мислите?

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните за коментарите ви.