Действительно ли сайт закрыт для индексирования в файле robots.txt?

Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#1
После обновления cinemapress, сайт закрыт к индексированию. И нет кнопки как на демо чтобы открыть.
User-agent: *
Disallow: /
 

Вложения

Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#3
Сайт открыт, проверять это можно в вебмастере Яндекса или Google.

https://enota.club/threads/blokirov...-podozritelnoj-aktivnosti-na-kino-sajte.2759/
Сайт закрыт для индексирования в файле robots.txt
При последнем обращении к файлу robots.txt робот обнаружил, что сайт закрыт для индексирования. Из-за этого сайт может полностью пропасть из поиска. Убедитесь в корректности файла robots.txt — обратите внимание на директиву вида Disallow: / (запрещает обход всего сайта).
Проверьте robots.txt и снимите установленный запрет. О том, как правильно написать указания для робота Яндекса, читайте в Справке.
 
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#4
Также, автоматически не скрываются фильмы в разделе Автоматическое скрытие фильмов, все данные заполнены
 
Регистрация
15 Дек 2017
Сообщения
5,067
#5
Анализ и ответ сервера, что говорит в Яндексе?

1610992351430.png
 
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#6

Вложения

Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#9

Вложения

Последнее редактирование:
Регистрация
15 Дек 2017
Сообщения
5,067
#10
Откройте терминал и посмотрите, не блокируются ли боты как FAKE.

cinemapress upd

cinemapress logs bot

1611159349467.png
 
Регистрация
15 Дек 2017
Сообщения
5,067
#15
Выполние в терминале:

docker exec -it example_com bash -c 'wget -qO r.js https://pastebin.com/raw/8sRqEDVA && node r.js'

где example_com - Ваш домен через нижнее подчеркивание.

Вы должны увидеть такой результат:

1611163359469.png
 
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#16
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#18
Значит в логах FAKE, это действительно фейковые боты, а не настоящие.

Выполните обновление еще раз: cinemapress upd && cinemapress update
Готово, после переустановки опять:
User-agent: *
Disallow: /
 
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#20
Не важно что видит человек в robots. Там всегда будет Disallow. Важно что видит бот.
Доступ к отправленному URL заблокирован в файле robots.txt - это гугл в вебмастере, также не работает sitemap
 
Регистрация
15 Дек 2017
Сообщения
5,067
#21
Доступ к отправленному URL заблокирован в файле robots.txt - это гугл в вебмастере, также не работает sitemap
Удалите в списке всех ботов.
Оставьте одно слово - bot

1611506562058.png

В cinemapress logs bot

У Вас одни FAKE?
 
Енот
Новичо́к, через «о́»
Регистрация
10 Янв 2018
Сообщения
104
#22
Последнее редактирование:
Новичо́к, через «о́»
Регистрация
22 Янв 2021
Сообщения
41
#25
У меня подобная проблема. Но при проверки cinemapress logs bot все показывает TRUE, тем не менее Гугл не может проиндексировать сайт.
При запросе на индексацию получаю ответ:

Запрос на индексирование отклонен
Во время проверки были обнаружены ошибки индексирования URL.
Я выполнил действия которые тут были описаны и предложены, кроме cinemapress upd.
 
Регистрация
15 Дек 2017
Сообщения
5,067
#26
В Настройке публикации есть запрет на индексацию?

1611851876850.png
 
Новичо́к, через «о́»
Регистрация
22 Янв 2021
Сообщения
41
#27
Новичо́к, через «о́»
Регистрация
22 Янв 2021
Сообщения
41
#28
Хм странности. Я ничего не делал и решил там сделать индексации еще раз. и оно таки дало уже доступ. НО!

URL нет в индексе GoogleЭта страница не представлена в нашем индексе, но не по причине ошибки. Более подробные сведения представлены ниже. ПодробнееИЗУЧИТЬ ПРОСКАНИРОВАННУЮ СТРАНИЦУОтправлен запрос на индексированиеЗАПРОСИТЬ СНОВАinfoПокрытиеURL неизвестен GoogleКак обнаруженоФайлы SitemapОтсутствуетСсылающаяся страницаНе найденоURL может быть известен из других источников, которые в настоящее время не раскрываются.СканированиеПоследнее сканированиеОтсутствуетРобот, выполнивший сканированиеОтсутствуетСканирование разрешено?ОтсутствуетПолучение страницыОтсутствуетИндексирование разрешено?infoОтсутствует
 
Регистрация
15 Дек 2017
Сообщения
5,067
#32
Из-за w.tools кэширования, они не передают Вам никакой информации User-Agent о том, кто зашел к Вам на сайт, поэтому Вы не знаете бот это или человек. Узнавайте у них, как эту настройку исправить.

Удалите слово bot, оставьте поле пустым.
Вы будете считать, что к Вам заходят только люди.
Хотя сайт и так всегда считает, что на нем только люди.

Никакие функции в админ-панели связанные с ботами у Вас работать не будут (поддомены, перенаправления, микроразметка, и т.д.).
 
Новичо́к, через «о́»
Регистрация
7 Окт 2019
Сообщения
12
#33
Здравствуйте!
В админке настроил User-agent: * Allow: / в robots.txt но при переходе site.site/robots.txt

User-agent: *
Disallow: /

и не работает карта сайта?