Содержание

Gemini (протокол)

Gemini - сетевой протокол прикладного уровня, являющийся наследником протокола Gopher.

Ориентирован на минимализм и приватность, поскольку исключает использование таких технологий как сжатие, Cookies и JavaScript; формат передаваемых данных ограничен текстом или бинарными данными, обязательной является подпись TLS.

Тем не менее, протокол вполне многофункционален и позволяет работать с различными типами ресурсов: как хостинг статических файлов так и системы с авторизацией и обработкой пользовательских запросов - форумы, поисковые системы, организация радио и видео вещания, обмен изображениями и другими мультимедийными данными.

В виду своих характеристик, Gemini будет интересен тем, кого не устраивает «раздутость» современного протокола HTTP, а также подойдёт для пользователей командной строки, E-ink планшетов.

Терминология

Как и во многих других экосистемах, для Gemini характерна своя терминология, знание которой поможет лучше понимать контекст и формировать поисковые запросы.

Разметка

Gemtext

Текстовые ресурсы gemtext - это обычный текст (MIME text/gemini) опционально содержащий мета-теги в начале каждой строки:

# h1
## h2
### h3
=> ссылка
> цитата
* элемент списка
``` 
исходный код
```

Некоторые браузеры поддерживают разметку inline:

``` заголовок неформатируемого блока
*bold*
_underline_

В разметке gemini не используются декоративные технологии вроде CSS, при этом задача отрисовки ресурса выполняется на стороне браузера и полностью делегирована клиенту.

Различные браузеры по-разному отрисовывают содержимое, некоторые добавляют отступы.
Поэтому главный принцип создания «кроссбраузерных» страниц - разметка должна удобно читаться в исходном виде.

Gemfeed

Поскольку текстовый регламент протокола не подразумевает использование тегов, такие стандарты оповещений как Atom и RSS, без внешних средств интеграции, в Gemini неприменимы.

Несмотря на это, нативные подписки возможны - средствами стандарта для программной интерпретации изменений документа gemtext.

Говоря проще, протокол сохраняет человеко-понятную структуру документа, при этом позволяет клиентским приложениям отслеживать его обновления.

В браузере Lagrange, подписаться на обновления страницы можно с помощью меню Bookmarks - Subscribe to page… и выбрать соответствующий странице способ (меню подписок: View - Show Feeds)

Отслеживание по дате

В данном подходе, осуществляется отслеживание по впереди идущей за ссылкой дате, в формате ISO 8601 (Y-m-d), например:

/index.gmi
# Заголовок страницы, выполняет роль заголовка фида

Содержимое параграфа, игнорируется

=> /index.gmi любая ссылка, игнорируется

## Подраздел страницы, игнорируется

Произвольное содержимое подраздела, игнорируется

## Публикации

=> /pub1.gmi 2024-01-28 Ссылка на первую публикацию, отслеживается
=> /pub2.gmi 2024-01-29 Ссылка на вторую публикацию, отслеживается
=> /pub3.gmi Ссылка публикацию, не отслеживается (так как не содержит даты)
=> /pub4.gmi Ссылка публикацию, не отслеживается (так как дата является частью заголовка) 2024-01-30

Таким образом, документ не теряет читаемость для человека и при этом содержит мета-информацию для интерпретатора обновлений.

Единственный недостаток такого подхода заключается в том, что обновления нельзя получать чаще, чем раз в сутки. Как заявлено в документации, связано это с временной зоной.

Отслеживание по заголовкам

Альтернативный подход, отслеживающий изменения в заголовках документа

blog.gmi
# Мой блог, заголовок фида

Параграф описания

## Первая публикация, отслеживается

Описание первой публикации

=> /pub1.gmi Читать

## Вторая публикация, отслеживается

Описание второй публикации

=> /pub2.gmi Читать

...

Коды статусов

Клиент обязан отклонять любой код меньше 10 или больше 69, при этом уведомить пользователя.

В неопределённых случаях, приоритет будет отдан коду с начальным значением диапазона, например, 10 для 11 или 20 для 27.

Обработка запросов

Протокол предусматривает обмен пакетами с заголовками длиной максимум 1024 байт. В эту длину необходимо уместить мета информацию пакета - например строку URI и/или данные пользовательского ввода.

Текстовые данные должны быть закодированы в стандарт RFC 3986 (известный такими функциями, как urlencode). В какой то степени, это сокращает полезный объём заголовка при использовании например кириллицы.

Тело пакета состоит из «сырых» текстовых или бинарных данных без сжатия; сервер закрывает соединение после отправки последнего байта.

С помощью отправляемых клиенту статусов группы «10», сервер способен запрашивать пользовательский ввод (вместо привычных форм, обычно в браузерах Gemini - это всплывающее текстовое окно) После получения и обработки данных, сервер обычно возвращает статус «20», статус «51» (не найдено) или редирект на целевую страницу с кодом «30».

Пример типичного пакета с фразой «Hello world!»:

20 text/gemini; charset=utf-8; lang=en\r\nHello%20world%21

Клиент

Чтобы открыть ресурс с адресом gemini:// необходим специальный браузер, стандартно работающий с портом 1965.

Пользователи GUI, могут начать с популярных Lagrange, Eva, Kristall и других.

Специфика

Сервер

Понятие «сервер» в среде Gemini может быть непривычным для пользователей веб, поскольку вместо прокси Nginx или Apache, этот термин зачастую предусматривает полноценный сервис для конкретной задачи, резервирующий за собой отдельный хост и порт.

В каталоге awesome-gemini представлено большое количество таких решений.

Например, для запуска простой статики, подойдёт сервер Agate (Rust). При этом, название привычного index.html будет зависеть от выбранного сервера, для Agate - это index.gmi

Запуск динамических ресурсов часто предусматривает разработку собственного сокет-сервера для реализации специфики отдельно взятого приложения.

Веб-разработчикам проще понять принцип работы «server-side» на примере нескольких файлов gemini-php. В разработке новых приложений на PHP, лучше использовать актуальные решения - например Ratchet - многофункциональную библиотеку для организиации асинхронных сокет-серверов.

Виртуальные хосты

Чтобы запускать различные сервисы на одном IP (не меняя стандартный порт) следует установить общий прокси-сервер, который будет осуществлять маршрутизацию запросов на соответствующий адрес/интерфейс.

Если для HTTP - это Apache или Nginx, то для протокола Gemini используются следующие решения:

Ресурсы

Yggdrasil

TLS

Спорным моментом является обязательное шифрование TLS поверх уже имеющегося слоя.

Также сертификат TLS предусматривает наличие CN записи, что может стать проблемой при выборе сервера с поддержкой CN/SNI в формате IPv6.
Разработчики серверов не ймут сути вопроса по части отсутствия домена и если есть задача работать с классической адресацией Yggdrasil, вероятно придется находить решения самостоятельно - например сделать свой сервер на базе Ratchet.

В виду указанных особенностей, более целесообразным выбором для сети Yggdrasil может быть протокол Nex.

DNS

Пользователи DNS с подключением через Yggdrasil и в частности - Alfis DNS, использующего стандартно AdGuard, могут столкнуться с задержками при открытии казалось-бы легковесных страниц Gemtext. Связано это с относительно простым устройством внутрисетевых браузеров, разработчики которых не особо стремятся вникать в особенности альтернативных подключений. В то время, как HTTP браузеры из коробки имеют встроенные инструменты кеширования, пользователи Gemini могут ускорить загрузку с помощью кеширующих DNS серверов. Также можно снизить задержки для резольва Clearnet, указав DNS CloudFlare (1.1.1.1) с обычно наиболее высокими показателями отклика.

Внутрисетевые ресурсы

Похожие протоколы

Сравнение

                             gemini       spartan           scroll                nex
                             ------       -------           ------                ---
naming scheme                space        sparta/greece     scrolls & libraries   cityscape & highways
transport                    TCP + TLS    TCP               TCP + TLS             TCP
request structure            full URL     hostname & path   full URL              path
request encoding             utf-8        us-ascii          utf-8                 utf-8
status codes                 18           4                 18                    0
document type                text/gemini  text/gemini       text/scroll           text/plain
input prompt                 1x status    "=:" prompt line  1x status             none

data upload                  limited      yes               limited               no
mimetypes                    yes          yes               yes                   no
virtual hosting              yes          yes               yes                   no
same-site redirects          yes          yes               yes                   no
cross-site redirects         yes          no                yes                   no
proxy requests               yes          no                yes                   no
"lang" response parameter    yes          no                yes                   no
lang request parameter       no           no                yes                   no
response metadata            heuristic    heuristic         yes                   heuristic
abstract/metadata requests   no           no                yes                   no

link relationships           heuristic    heuristic         yes                   heuristic
list nesting                 no           no                yes                   heuristic  

Источник: gemini://scrollprotocol.us.to

Статьи внутри раздела

Ссылки