Існує невелика кількість джерел інформації на які покладається практично кожен оптимізатор пошукової системи. Google Search Console (В минулому Google Webmaster Tools) став мабуть самим широко поширеним. Просто, існують деякі речі, які ви можете виконати за допомогою GSC, як наприклад, відхилення посилань, чого не можна зробити де-небудь ще, тому в деякій мірі ми змушені покладатися на нього. Але, як і з будь-яким джерелом даних, ми повинні протестувати його, щоб визначити достовірність інформації - чи можемо ми робити ставку на ці рекомендації в нашому ремеслі? Давайте подивимося чи зможемо ми зняти завісу з даних GSC і визначити, раз і назавжди, наскільки скептично нам варто відноситься до даних, які він надає.
Тестування джерел даних
Перед тим, як почати, я думаю варто трохи обговорити те, як ми могли б вирішити цю проблему. Є два основних поняття, які я хочу представити для цього аналізу: внутрішня валідність і зовнішня валідність.
Внутрішня валідність вказує точно чи дані відображають те, що відомо Google про ваш сайт.
Зовнішня валідність вказує точно чи дані відображають, що відбувається в мережі Інтернет.
Ці два поняття дуже важливі для нашої дискусії. Залежно від проблеми, яку ми вирішуємо, як оптимізатори, нас може більше хвилювати та чи інша. Наприклад, давайте припустимо, що швидкість сторінки була неймовірно важливим фактором ранжирування, і ми хотіли допомогти клієнту. Ми, ймовірно, будемо зацікавлені у внутрішній валідності метрики GSC «час, витрачений на завантаження сторінки», тому що, незалежно від того, що відбувається з боку реального користувача, якщо Google вважає, що сторінка є повільною, ми будемо втрачати позиції. Будемо спиратися на цю метрику, оскільки ми впевнені, що вона відображає думку Google про сайт замовника. З іншого боку, якщо ми намагаємося перешкоджати Google в пошуку поганих посилань, ми будемо стурбовані зовнішньої валідність розділу «посилання на ваш сайт», тому що, хоча Google, можливо, вже знає про деякі поганих посиланнях, ми хочемо переконатися, що немає ніяких інших , на які Google може наштовхнутися. Таким чином, в залежності від того, наскільки добре вибіркові посилання GSC в повному обсязі відображають посилання в мережі Інтернет, ми могли б відмовитися від цієї метрики і використовувати комбінацію інших джерел (наприклад, Open Site Explorer , Majestic і Ahrefs ), Який дадуть нам більше охоплення.
Суть цього прикладу - просто сказати, що ми можемо судити про дані, що надаються GSC, з різних ракурсів, і дуже важливо відокремити їх, щоб знати, коли має сенс покладатися на GSC.
GSC Розділ 1: HTML Покращення
Серед безлічі корисних функцій в GSC, Google надає список деяких найбільш поширених помилок HTML, які він виявив під час сканування вашого сайту. В цьому розділі, розташованому за адресою Search Appearance> HTML Improvements, перераховано кілька потенційних помилок, включаючи дублі тайтлів, дублі дескріпшенов, а також, інші тебующіе вжиття заходів рекомендації. На щастя, цей перший приклад дає нам можливість намітити методи для тестування, як внутрішньої, так і зовнішньої валідності даних. Як ви можете бачити на скріншоті нижче, GSC знайшов дублі мета-описів, тому що сайт має не чутливі до регістру URL і, відсутній канонічний тег або редирект, щоб виправити це. По суті, ви можете перейти на сторінку з будь-якої /Page.aspx або /page.aspx, і це безперечно, оскільки Googlebot знайшов URL, незалежно від того чи був врахований регістр. Давайте перевіримо рекомендацію від Google, щоб побачити, валидна вона зовні і внутрішньо.
Зовнішня валідність: В цьому випадку зовнішня валідність - це просто інформація про те, чи правильно дані відображають сторінки в такому вигляді, як вони з'являються в Інтернеті. Як можна вже зрозуміти, список поліпшень HTML може бути безнадійно застарілим, що залежить від швидкості сканування вашого сайту. В цьому випадку, сайт раніше виправив помилку за допомогою 301 редіректу.
Це насправді не так вже й дивно. Не слід очікувати, що Google буде оновлювати цей розділ GSC кожен раз, коли ви застосуєте виправлення до свого веб-сайту. Проте, він наочно показує типову проблему з GSC. Багато з помилок, про які GSC попереджає вас, можливо, вже були виправлені вами або вашим веб-розробником. При всьому бажанні, я не думаю, що це вина GSC, це просто обмеження, яке може бути вирішено тільки шляхом більш частого навмисного сканування, як аудит індексування Moz Pro або окремим інструментом, як Screaming Frog .
Внутрішня валідність: тут все стає цікавіше. Хоча не дивно, що Google не індексує ваш сайт так часто, щоб фіксувати поновлення на вашому сайті в режимі реального часу - резонно було б очікувати, що проскановані Google дані будуть відображені точно в GSC. Це, схоже, не так.
При виконанні запиту info: http: // concerning-url в Google великими літерами, ми можемо визначити, якусь інформацію про те, що Google знає про це URL. Google видає результати для версії URL, прописаним малими літерами! Це вказує на те, що Google знає про 301 редирект, для усунення проблеми, і скорегував його в своєму пошуковому індексі. Як вже можна зрозуміти, це показує досить серйозну проблему. Рекомендації щодо поліпшення HTML в GSC не тільки можуть не відображати зміни, внесені на вашому сайті, вони можуть навіть не відображати коригування, про які Google вже знає. З огляду на таку різницю, майже завжди має сенс сканувати ваш сайт додатково за цими типами проблем, разом з використанням GSC.
GSC Розділ 2: Статус Індексу
Наступний метрикою, з якої нам належить розібратися - цей Статус Індексу в Google, який повинен надати вам точну цифру сторінок, проіндексованих Google з вашого сайту. Цей розділ знаходиться в Google Index> Index Status. Ця конкретна метрика може бути перевірена тільки на внутрішню валідність, так як вона надає нам інформацію виключно про самому Google. Є кілька способів, як можна було б вирішити це ...
- Ми могли б звірити число, представлене в GSC з тим, яке відображається через команди site:
- Ми могли б порівняти кількість наведене в GSC з числом внутрішніх посилань на головну сторінку в розділі внутрішніх посилань (за умови: 1 посилання на головну сторінку з кожної сторінки на сайті)
Ми вибрали обидва способи. Найбільша проблема з цієї конкретної метрикою - бути впевненим в тому, що вона вимірює. Оскільки GSC дозволяє вам авторизувати HTTP, HTTPS, WWW, і без-WWW версії сайту незалежно один від одного - це може ввести в оману щодо того, що входить в метрику Статус Індексу.
Ми виявили, що при акуратному застосуванні, щоб переконатися у відсутності перетинів різного типу (HTTPS проти HTTP, WWW проти без-WWW), метрика Статус Індексу, здається, досить добре корелює із запитом site: site.com в Google, особливо з невеликими сайтами . Чим більше сайт, тим більші відхилення ми бачили в цих цифрах, але це може бути за рахунок аппроксимаций, виконаних командою site :.
Однак, ми прийшли до висновку, що метод підрахунку посилань буде важко використовувати. Розглянемо малюнок вище. Сайт, про який йде мова, має 1587 сторінки в індексі згідно GSC, але домашня сторінка цього сайту має 7,080 внутрішніх посилань. Це здається вкрай нереалістичним, оскільки нам не вдалося знайти жодної сторінки, не кажучи вже про більшість сторінок, з 4-ма або більше посиланнями на головну сторінку. Однак, з огляду на узгодженість команди site: і Статусу Індексу GSC, я вважаю, що проблема криється більше в способі відображення внутрішніх посилань, ніж в метриці Статус Індексу.
Я думаю, можна без побоювань зробити висновок про те, що метрика Статус Індексу, ймовірно, самий надійний з доступних нам, щодо підрахунку кількості сторінок фактично включених в індекс Google.
GSC Розділ 3: Внутрішні посилання
Розділ Внутрішні посилання, який знаходяться під Search Traffic> Internal Links, здається використовується рідко, але може бути вельми пізнавальним. Якщо Зовнішні посилання говорять Google про те, що вважають важливим на вашому сайті інші, то внутрішні посилання вказують Google на важливе, на вашу думку, на вашому сайті. Цей розділ ще раз служить корисним прикладом розуміння різниці між тим, що Google стверджує щодо вашого сайту і як насправді йдуть справи з вашим сайтом.
Тестування цієї метрики було досить простим. Ми взяли кількість внутрішніх посилань, надане GSC, і порівняли його з повним обходом сайту. Тоді ми могли визначити, чи був досить репрезентативним обхід Google для даного сайту.
В цілому, ці два показники скромно корелювали, з деяким досить значним відхиленням. Як SEO, я вважаю, це дуже важливим. Google не починає з вашої головної сторінки і сканує ваш сайт таким же чином, як і стандартні пошукові роботи вашого сайту (як той, який входить до складу Moz Pro). Googlebot заходить на ваш сайт за допомогою поєднання зовнішніх посилань, внутрішніх посилань, Sitemaps, редиректів і т.д., які можуть дати зовсім іншу картину. Насправді, ми знайшли кілька прикладів, коли повний обхід сайту виявив сотні внутрішніх посилань, які пропустив Googlebot. Навігаційні сторінки, такі як сторінки категорій в блозі, відвідувалися рідше, тому деякі сторінки не накопичили таку кількість посилань в GSC, як можна було б очікувати, подивившись тільки на результат традиційного обходу.
Як пошукові маркетологи, в даному випадку, ми повинні бути стурбовані внутрішньої валідність, або тим, як Google бачить наш сайт. Я настійно рекомендую порівнювати числа Google з вашими власними результатами обходу, щоб визначити, чи є важливий контент, який згідно Google, був не врахована у внутрішній перелинковке.
GSC Розділ 4: Посилання на ваш сайт
Дані по посиланнях завжди є одними з найбільш затребуваних показників в нашій галузі, і це правильно. Зовнішні посилання продовжують залишатися самим сильним прогностичним фактором для ранжирування і, Google зізнавався в цьому неодноразово. Так як же виглядають GSC дані по посиланнях?
У цьому аналізі, ми порівняли посилання, представлені в GSC з представленими в Ahrefs, Majestic і Moz для того, щоб визначити діючі ці посилання до сих. Щоб бути об'єктивним по відношенню до GSC, який показує тільки вибіркові посилання, ми використовували тільки сайти, які мали всього менше ніж 1000 зворотних посилань, збільшуючи ймовірність того, що ми отримуємо повну картину (або принаймні близьку до неї) від GSC. Результати вражаючі. Обидва списки GSC, «вибіркові посилання» і «останні посилання,» показували найгірші результати щодо «діючих посилань" для кожного тестованого нами сайту, ні разу не обійшовши за якістю Moz, Majestic, або Ahrefs.
Я хочу бути відкритим і чесним щодо ефективності роботи Moz в даному тесті. Оскільки Moz має менший загальний індекс, найімовірніше, ми виявляємо тільки високоякісні, довговічні посилання. Наше перевагу над Majestic і Ahrefs всього на пару відсотків, ймовірно, побічний ефект розміру індексу і не відображає істотної різниці. Тим не менше, кілька відсотків, які відокремлюють GSC від всіх 3-х індексів посилань, не можна ігнорувати. З точки зору зовнішньої валідності - таким чином, ми бачимо наскільки добре ці дані відображають те, що насправді відбувається в інтернеті - GSC перевершили сторонні індекси.
Але як щодо внутрішньої валідності? Чи дасть GSC нам свіжий погляд на фактичний індекс зворотних посилань в Google? Здається, що вони однакові, оскільки рідко відображаються в звіті посилання, про які Google вже відомо, більше не знаходяться в індексі. Ми рандомно вибрали сотні URL-адрес зі статусом «більше не знайдені», відповідно до нашого тестом, щоб визначити, чи зберігає ще Googlebot старі версії цих адрес в кеші, що, так само, було доказом цього. У той час, як ми не можемо бути впевнені, що він показує повну інформацію про індекс посилань в Google щодо вашого сайту, ми можемо бути впевнені в тому, що Google, в більшості випадків, показує тільки ті результати, які відповідають його останніми даними.
GSC Розділ 5: Аналіз пошукових запитів
Аналіз пошукових запитів, ймовірно, є найбільш важливою і найбільш використовуваною функцією в Google Search Console, так як вона дає нам деяке уявлення про дані, втрачених Google під час оновлень, зі статусом «Не вказано», відповідно до Google Analytics. Багато з них, по праву, поставили під сумнів точність даних, тому ми вирішили придивитися до них ближче.
експериментальний аналіз
Розділ Search Analytics дав нам унікальну можливість використовувати експериментальний проект для визначення достовірності даних. На відміну від деяких інших показників, які ми перевірили, ми могли контролювати реальність, генеруючи кліки, при певних обставинах, для окремих сторінок на сайті. Ми розробили дослідження, яке працювало за планом на зразок цього:
- Створити серію безглуздих текстових сторінок.
- Поставити на них посилання з внутрішніх джерел, щоб заохотити індексацію.
- Використання добровольців для виконання пошуку абсурдних термінів, який неминуче виявить точну відповідність з створеним нами безглуздим контентом.
- Змінити обставини, при яких ці добровольці виконують пошук, щоб визначити, чи відслідковує GSC кліки та покази тільки за певних умов.
- Використання добровольців, щоб кликати на ці результати.
- Запис їх дій.
- Порівняти з даними, наданими GSC.
Ми вирішили перевірити, 5 різних умов для достовірності:
- Користувач виконує пошук в Chrome, будучи залогіненним в обліковий запис Google.
- Користувач не залогінені і, виконує пошук в Chrome в режимі інкогніто.
- Користувач виконує пошук з мобільного пристрою.
- Користувач не залогінені і, виконує пошук в Firefox.
- Користувач виконує той же пошук 5 разів протягом дня.
Ми сподівалися, що ці варіанти дадуть відповідь на конкретні питання про методи збору Google даних для GSC. Ми були дуже і поголовно розчаровані.
Experimental results (Результати експерименту)
Method (Метод)Delivered(Результат)
GSC Impressions
(Покази GSC)
GSC Clicks
(Кліки GSC)
Logged In Chrome
(Залогінитися в Chrome)
11 0 0 Incognito
(Анонімний перегляд)
11 0 0 Mobile
(Мобільний пристрій)
11 0 0 Logged Out Firefox
(Не залягання, Firefox)
11 0 0 5 Searches Each
(5 пошуків кожен)
40 2 0
GSC зафіксував лише 2 показу з 84 і абсолютний 0 кліків. З огляду на ці результати, я негайно був стурбований з приводу експериментального проекту. Можливо, Google не фіксує дані по цих сторінках? Можливо, ми не досягли мінімальної кількості, необхідного для фіксації даних, чи намагаючись його перевершити в останньому дослідженні, за допомогою 5 пошуків на одну людину?
На жаль, жодне з цих пояснень не дозволяє повністю зрозуміти, що сталося. Що цікаво, деякі з тестових сторінок набрали сотні показів по химерним, низькочастотних ключових словах, які тільки що виникли випадковим чином, в результаті випробувань безглуздих сторінок. Більш того, за багатьма сторінках сайту зареєстровано дуже мала кількість показів і кліків, і якщо порівнювати з даними Google Analytics - вони насправді отримали дуже мало кліків. Цілком очевидно, що на GSC не можна покладатися, незалежно від обставин користувача, щодо низькочастотних запитів. Він, згідно з цією оцінкою, зовні не дійсний - тобто, покази та кліки в GSC не відображають достовірно покази та кліки, що виконуються в Google.
Як вже можна зрозуміти, я не був задоволений цим результатом. Можливо, експериментальний проект мав деякі непередбачені недоліки, які міг би розкрити стандартний порівняльний аналіз.
Порівняльний аналіз
Наступним кроком, який я зробив, було порівняння даних GSC з іншими джерелами, щоб побачити чи можемо ми знайти якийсь зв'язок між представленими даними і другорядними параметрами, які могли б пролити світло на те, чому початковий експеримент GSC відбився так погано на якості даних . Найбільш простим, було порівняти GSC з Google Analytics. У теорії, звітність GSC за переходами повинна відображати фіксацію Google Analytics органічних кліків в Google, якщо не бути ідентичною, то по крайней мере, пропорційної. Через проблеми, пов'язаних з масштабом експериментального проекту, я вирішив спочатку спробувати групу великих сайтів.
На жаль, результати були дуже різні. Перший приклад сайту отримав близько 6000 кліків за день в органічному пошуку Google, згідно GA. Десятки сторінок з сотнями органічних кліків на місяць, відповідно до GA, отримали 0 кліків, згідно даних GSC. Але, в даному випадку, я був в змозі виявити винуватця, і це було пов'язано з тим, як відстежувалися кліки.
GSC відстежує Клік, Заснований на URL в результатах поиска (скажімо, ви натіскаєте на /pageA.html). Проте, давайте припустимо, що /pageA.html перенаправляє до /pagea.html, тому що ви були розумні і вирішили виправити дану помилку, яка обговорювалося на початку статті. Якщо Googlebot не врахував це виправлення, то Google Search буде як і раніше мати старий URL, але клік буде зафіксований в Google Analytics за скоригованим URL, так як це сторінка на якій запускається GA код. Просто так сталося, що за останній час на першому тестируемом сайті було зроблено багато поправок, і коефіцієнт кореляції GA з GSC склав лише 0,52!
Так, я почав пошуки інших параметрів, які могли б забезпечити більш чітку картину. Після аналізу декількох параметрів, без подібних проблем, як в першому випадку, ми визначили діапазон кореляції приблизно від 0,94 до 0,99, між звітами GSC і Google Analytics по органічним цільовим сторінкам. Це здається досить великим показником.
І, нарешті, ми зробили ще один тип порівняльної аналітики для визначення достовірності даних GSC по ранжирування. В цілому, кількість кліків, отриманих сайтом, має залежати від числа показів, і позиції в SERP. Хоча, очевидно, це неповне уявлення всіх факторів, справедливо буде сказати, що ми могли б порівняти якість двох груп ранжирування, якщо знаємо, кількість показів і кількість кліків. У теорії, метод відстеження позицій, який краще передбачає кліки, беручи до уваги покази, є кращим з двох.
Скажіть, що я не здивувався, але це було зовсім не так. Стандартні методи відстеження позицій набагато краще впоралися з прогнозом фактичного кількість кліків, ніж позиції, як представлено в Google Search Console. Ми знаємо, що дані GSC відображають середні позиції, що майже напевно представляє неправдиву картину по позиціях. Існує багато сценаріїв, при яких дані є достовірними, але дозвольте мені пояснити один. Уявіть, що ви додали новий контент і ваше ключове слово починається з позиції 80, потім переходить до 70, потім 60, і в кінцевому підсумку - № 1. Тепер уявіть, що ви створюєте іншу частину контенту і він розташований на 40-й позиції, яка ніколи не змінюється. GSC зафіксує середню позицію 40 для обох частин контенту. Хоча, перший отримає значний трафік за час перебування на 1-ій позиції, чого ніколи не трапиться з другим. Метод усереднення GSC на основі даних показів дуже сильно вуалює основні властивості, щоб забезпечити відповідні прогнози. Поки щось явно не зміниться в методі компанії Google зі збору даних для ранжирування в GSC, він не буде відповідним для з'ясування справжньої поточної позиції вашого сайту.
узгодженість
Отже, як же поєднати експериментальні результати з порівняльними, як позитивні так і негативні сторони GSC Search Analytics? Що ж, я думаю, є кілька явних висновків.
- Дані по показам вводять в оману, в кращому випадку, і є просто брехнею, в гіршому: Ми можемо бути впевнені, що всі покази не враховуються і не точно відображені в даних GSC.
- Дані за переходами пропорційно точні: кліках можна довіряти, як пропорційної метриці (тобто співвідноситься з реальністю), але не в якості конкретної величини.
- Дані за переходами говорять про те, які URL ранжуються, а не на які сторінки вони насправді ведуть.
Розуміння цієї узгодженості може бути дуже цінним. Наприклад, якщо ви виявите, що ваші дані про кліки в GSC не пропорційні даними в Google Analytics, існує висока ймовірність використання вашим сайтом редиректів таким чином, що Googlebot до цих пір не встановив чи не включив їх. Це може свідчити про внутрішню проблему, яку необхідно вирішити.
останні думки
Google Search Console надає багато безцінних даних, на які покладаються розумні веб-майстри в прийнятті маркетингових рішень. Проте, ми повинні продовжувати ставитися скептично до цих даних, як і до будь-якого іншого джерела даних, і тестувати їх на внутрішню і зовнішню валідність. Ми також, повинні звернути особливу увагу на відповідні правила, згідно яких ми використовуємо дані, щоб не робити висновки, які є небезпечними або ненадійними, де дані непереконливі. Можливо, найголовніше: перевірити, перевірити, перевірити. Якщо у вас є кошти, використовувати різні інструменти і сервіси для перевірки даних, які ви знайдете в Google Search Console - це дасть гарантію вам і вашій команді, що ви працюєте з надійними даними.
Але, як і з будь-яким джерелом даних, ми повинні протестувати його, щоб визначити достовірність інформації - чи можемо ми робити ставку на ці рекомендації в нашому ремеслі?Так як же виглядають GSC дані по посиланнях?
Але як щодо внутрішньої валідності?
Чи дасть GSC нам свіжий погляд на фактичний індекс зворотних посилань в Google?
Можливо, Google не фіксує дані по цих сторінках?
Можливо, ми не досягли мінімальної кількості, необхідного для фіксації даних, чи намагаючись його перевершити в останньому дослідженні, за допомогою 5 пошуків на одну людину?