Как определить ссылку в качестве канала RSS-каналов, используя ROME?


0

Я использую библиотеку ROME для разбора фидов. Я хочу знать, как я могу идентифицировать ссылку как ссылку XML или обычную ссылку. Есть ли поддержка для этого в ROME.

0

Звучит так, будто вы говорите, что вы будете получать кучу ссылок откуда-нибудь (содержимое RSS-канала или что-то еще). Затем вы хотите пройти через них и определить, являются ли они RSS/Atom-фидами или регулярными страницами HTML.

Возможно, вы попытаетесь достать его вместе с Римом, а затем посмотреть, создает ли оно исключение. Лучшим вариантом может быть вытащить документ в конце каждой ссылки и посмотреть, что говорит заголовок.

Имейте в виду, что при извлечении каждой ссылки может возникнуть проблема, если кто-то ссылается на очень большой файл.

Вы можете посмотреть, как использовать команду HEAD, чтобы узнать, какой тип файла вы собираетесь получить в конце ссылки, прежде чем загружать всю вещь.