Содержание

YGGtracker v1

В материале рассмотрена устаревшая версия проекта.
Для получения актуальной информации, обратитесь в индексный раздел YGGtracker

Проект c открытым исходным кодом для организации децентрализованного веб-реестра BitTorrent для сети Yggdrasil.

Серверная часть реализована на базе MySQL, SphinxQL и PHP 8, интерфейс - средствами HTML/CSS, без использования JavaScript, поэтому функционально совместим с браузерами, где эта функция отключена.

Базовые функции

Помимо каталога и поиска, на данный момент реализованы социальные функции: комментирование, лайки, просмотры а также информация об активных раздачах.

Также, движок поддерживает фиды RSS, Sitemap и JSON API.

В ближайшее время, планируется добавить такие функции, как лента активности, загрузка и обмен файлами, форки раздач и т.д. Предусмотрена но не реализована в полной степени возможность локализации посредством Crodwin, Transifex и других площадок коллективных переводов.

Подробнее о ходе разработки и ожидаемых функциях, можно ознакомиться в разделе README проекта.

Аутентификация

YGGtracker использует внутрисетевой адрес для идентификации пользователя без привычной регистрации с указанием логина, пароля или email. Также для входа не требуется наличие сторонних централизованных серверов аутентификации. Подлинность пользователя при авторизации гарантируется соответствием уникального адреса IPv6, подписанного локально приватным ключом Yggdrasil в диапазоне 0200::/7.

На данный момент, сервер YGGtracker использует для авторизации адрес удаленного узла (REMOTE_ADDRESS) и не предусматривает авторизацию посредством общих прокси-серверов, в том числе заголовков X-FORWARDED-FOR в виду возможности фальсификации. Поэтому используя совместные ресурсы, такие как бесплатные прокси сервера и VPN, пользователь должен учитывать факт возможности утери доступа к аккаунту или наличия сторонней активности от его имени.

В перспективе, возможна разработка опции дополнительного ключа идентификации, позволяющего идентифицировать отдельного пользователя в рамках общеиспользуемого IP.

Виды учетных записей

YGGtracker является средой для работы с распределенным реестром данных, на момент написания статьи, поддерживаются два вида учетных записей - Distributed (распределенный) и Local (локальный).

При первом входе, пользователь указывает тип профиля и способ обработки его персональных данных.

При выборе типа профиля Local, активность и адрес пользователя остаются приватными и в рамках текущего узла. В режиме Distributed - активность и адрес пользователя будут доступны независимым узлам YGGtracker посредством JSON API, что позволяет работать с контентом на любом из серверов YGGtracker, в случае отключения одного их них.

На момент написания статьи, смены типа учетной записи не предусмотрено, но возможно будет добавлено в ближайшее время, в рамках настроек профиля.

Децентрализация

Данные в интернете представляют собой общественное достояние, создание которого требует усилий и времени. Централизованные решения чувствительны к цензуре и зависимы от администрации, с ростом популярности нередко злоупотребляющей рекламой или вовсе передающей проекты в руки третьих лиц, в частности компаний, редко заинтересованных в первичной цели проекта.

Проект YGGtracker призван сделать BitTorrent раздачи доступными, а реестр каталога - устойчивым к отключениям и зависимости от определенной команды. В симбиозе с Yggdrasil, может быть легко организован любым желающим, как при наличии VPS, так и в рамках домашнего сервера, например сидбокса, не требуя при этом наличия выделенного IP или открытого 80/443 порта. База данных при этом, может быть мгновенно загружена с других узлов или создана с нуля для локальных потребностей.

Децентрализация данных YGGtracker совмещает использование следующих форматов взаимодействия:

Активный режим

Активный режим используется для мгновенной синхронизации активности пользователя между другими узлами. Для этого, при выполнении определенного действия, например создания пользователем (с уровнем Distributed) раздачи, комментария и т.д., сервер YGGtracker отправляет другим узлам мета-данные события.

Поскольку интерфейс не подразумевает работу с JavaScript, в частности асинхронными функциями, такие события сохраняются в оперативной памяти сервера посредством Memcached и рассылаются другим узлам в течении минуты по расписанию crontab.

Сделано это для того, чтобы пользователь ресурса не ощущал здержек при отсутствии подключения к другим узлам YGGtracker, в случае их временного отсутствия в сети.

Пассивный режим

Пассивный режим представляет собой обмен данными посредством фидов штатного API. Данный формат взаимодействия использует расписание crontab для создания локального и сбора удалённых фидов, оглашенных посредством манифеста отдельно взятого узла.

Использование такого подхода во многом востребовано, поскольку позволяет актуализировать данные в случае, когда один из узлов был временно недоступен при синхронизации в активном режиме.

Для идентификации данных, используется пара IPv6 пользователя и географически независимая метка времени (unixtime) контента.

Первичные ключи (идентификаторы) экспортируются отдающими, но не импортируются принимающими узлами и необходимы только для оптимизации памяти, при локальном построении реестров связей.

На данный момент, протокол поддерживает следующие фиды:

* от пользователей в группе Distributed

Фиды генерируются по расписанию в статичные дампы, поэтому обращение к ним не оказывает нагрузки на раздающий сервер. Интервал импорта и экспорта обновлений зависит от отдельно взятого узла, как правило, в зависимости от активности сети.

Время последнего обновления также указывается в поле updated файла manifest.json

Установка

Системные требования

Для организации узла YGGtracker потребуется наличие программных пакетов Sphinx, Memcached, Crontab, Nginx / Apache, MySQL и PHP. При наличии данного ПО, наличие root или VPS не обязательно.

Сервер YGGtracker не взаимодействует с сервисом Yggdrasil напрямую, но в оригинальной реализации, должен работать на узле, принимающем подключения с диапазона 0200::/7 локально или посредством прокси-шлюза.

Требования к процессору и оперативной памяти, во многом зависят от количества посетителей и объема данных, в частности, в режиме распределенного узла - размеров JSON фидов. В случае локального каталога, требования к серверу не больше чем, к обычному веб сайту.

MySQL

Устанавливаем сервер из репозитория:

apt install mysql-server

Выполняем предварительную настройку безопасности утилитой:

mysql_secure_installation

Добавляем базу данных, пользователя, указываем пароль и уровень доступа:

mysql -u root -p
mysql > CREATE DATABASE IF NOT EXISTS yggtracker;
mysql > CREATE USER 'yggtracker'@'localhost' IDENTIFIED BY 'YGGTRACKER_PASSWORD';
mysql > GRANT SELECT, INSERT, UPDATE, DELETE on *.* TO 'yggtracker'@'localhost' WITH GRANT OPTION;
mysql > FLUSH PRIVILEGES;
mysql > quit;

Теперь можно приступить к импорту структуры базы данных.

Проект и структура данных, расположены в файле /database/yggtracker.mwb.

Открыть данный формат можно официальным клиентом MySQL Workbench. Для импорта структуры, удобно использовать подключение по SSH, с помощью утилиты Database - Synchronize Model.

* при подключении посредством адреса IPv6, может быть ошибка на этапе верификации хоста, обойти её можно добавив вместо IP - виртуального хоста в файл /etc/hosts или использовать IPv4.

Sphinx

Sphinx - поисковый сервер с открытым исходным кодом, поддерживающий широкий спектр настроек, включая морфологию, словоформы, а также имеет встроенные алгоритмы релевантности, включая удобную выборку посредством языка SphinxQL.

Помимо прочего, Sphinx ориентирован на быстродействие, в виду хранения поисковых индексов в оперативной памяти.

Установка, как и в случае других пакетов, доступна из штатных репозиториев большинства дистрибутивов (включая ARM платформы):

apt install sphinxsearch

Далее, необходимо отредактировать файл конфигурации. Базовый пример также доступен /example/environment/sphinx.conf

nano /etc/sphinxsearch/sphinx.conf

Используя пример из официального репозитория, указываем только актуальные параметры подключения к БД, остальные настройки можно оставить по-умолчанию.

Сохраняем файл и запускаем сервис:

searchd

* иногда, запуск сервиса завершается ошибкой «FATAL: failed to create pid file '/run/sphinxsearch/searchd.pid': No such file or directory». Чтобы это исправить, необходимо вручную создать директорию:

mkdir /run/sphinxsearch

Теперь можно проверить работу индексатора, выполнив команду:

indexer --all --rotate

Для штатной работы YGGtracker, также указываем обновление индексов по расписанию crontab:

@reboot searchd
@reboot indexer --all --rotate

* * * * * indexer magnet --rotate

* в перспективе, планируется использование дельта-индексов, но в виду текущего объема данных в сети, в качестве временной меры, индекс обновляется ежеминутно.

** если сервер Sphinx не запускается при перезагрузке системы, можно добавить в crontab перед командой searchd - конструкцию sleep или использовать

systemctl enable sphinxsearch.service

Веб-сервер

Nginx

Настройка веб-сервера может отличаться, в зависимости от потребностей.

В данном примере, Nginx используется для веб-сервисов в сети Yggdrasil, расположенных в поддиректориях. В частности, для YGGtracker будет использоваться адрес вида http://[IP]/yggtracker

Устанавливаем зависимости:

apt install nginx memcached php-fpm php-memcached php-mysql php-pdo php-curl

Поскольку работа с DNS не подразумевается, редактируем стандартный файл настроек, предварительно создав его резервную копию:

cp /etc/nginx/sites-available/default /etc/nginx/sites-available/default.bak

nano /etc/nginx/sites-available/default

Актуальный пример содержимого также доступен в файле /example/environment/nginx

Ниже приведен пример текущей версии, с комментариями:

server {
	# Слушаем подключения только с IPv6, на 80 порту
	listen [::]:80 default;

	# Разрешаем доступ к ресурсу только в сети Yggdrasil
	allow 0200::/7;
	deny  all;

	# Оставляем по-умолчанию
	root /var/www/html;

	# Добавим поддержку файлов PHP
	index index.html index.htm index.nginx-debian.html index.php;

	# Название хоста и DNS в примере не используется
	server_name _;

	# Обработка ошибок 404
	location / {
		try_files $uri $uri/ =404;
	}

	# Подключаем сокет PHP актуальной версии
	location ~ \.php$ {
		include snippets/fastcgi-php.conf;

		# Версию PHP можно узнать командой php -v
		fastcgi_pass unix:/run/php/php8.1-fpm.sock;
	}

	# Запрещаем доступ к случайно загруженным на хост скрытым файлам вроде .vscode, .git и тд, не смотря на то, что они находятся уровнем выше
	location ~ /\. {
		deny all;
	}
}

Сохраняем и тестируем конфигурацию:

nginx -t

Перезапускаем сервер nginx:

service nginx restart

* на работающем сервере, перезапуск веб-сервера нежелателен, поэтому при внесении правок в конфигурацию, достаточно выполнить:

service nginx reload

Веб-сервер готов к работе.

При этом, в корне веб-сервера, будет отображено стандартное приветствие nginx. Этот путь можно использовать для основного приветствия, домашней странички или использовать 302 редирект на директорию /yggtracker.

YGGtracker

Установка из репозитория на GitHub включает межверсионные обновления и рекомендуется только для разработчиков.

Для установки стабильного релиза, используется пакетный менеджер Composer

apt install composer

Устанавливаем первую версию YGGtracker:

composer create-project yggverse/yggtracker=1.0.0

При использовании примера конфигурации сервера Nginx, установить проект в целевую директорию можно командой:

composer create-project yggverse/yggtracker /var/www/YGGverse/YGGtracker

Настраиваем доступы для веб-сервера:

chown -R www-data:www-data /var/www/YGGverse/YGGtracker
chmod -R 0770 /var/www/YGGverse/YGGtracker

При удаленной работе с файлами, удобно добавить пользователя в группу www-data

usermod -a -G www-data $USER

В целях безопасности, файлы приложения расположены уровнем выше публичной директории. На текущем примере конфигурации, для доступа из сети, создадим ссылки:

ln -s /var/www/YGGverse/YGGtracker/src/public /var/www/html/yggtracker

При первом обращении к сайту, автоматически будут созданы файлы среды окружения (src/config/.env и src/config/env.default.php).

Актуальная структура файла конфигурации, доступна в файле example/environment/env.example.php

Редактируем, указывая подключение к серверам MySQL, Sphinx, memcached а также локальные настройки узла, например лимиты и правила ресурса.

В частности, обращаем внимание на следующие константы:

// Подключение к серверу MySQL

define('DB_PORT', 3306);
define('DB_HOST', 'localhost');
define('DB_NAME', '');
define('DB_USERNAME', '');
define('DB_PASSWORD', '');

// Добавляем модераторов, используя IPv6 в диапазоне 0200::/7 

define('MODERATOR_IP_LIST', (array)
  [
    '127.0.0.1',
    // ...
  ]
);

// Если не хотим работать в децентрализованном формате - указываем false

define('API_ENABLED', true);

Остальные настройки можно оставить по-умолчанию или изменить под свои требования.

В режиме распределённого узла, при обмене данными, производится сверка совместимости условий манифеста. Поэтому при несоответствии настроек, контент частично или полностью может быть проигнорирован, например, если длина заголовков вне диапазона принимающей стороны.

Для максимальной совместимости, лучше использовать стандартный набор правил или предложить настройки другим участникам сети, посредством отправки PR.

Подробности взаимодействия узлов и тонкая настройка API, будет рассмотрена в отдельном разделе. В ближайшее время планируется добавление поддержки мета-тегов, с помощью которых, можно интегрировать импорт и экспорт тематических данных, например для книжных, музыкальных или видео-каталогов.

Завершая установку приложения, добавим расписание в crontab (актуальная версия расписаний и рекомендуемые интервалы, также указаны в файле /example/environment/crontab):

* * * * * /usr/bin/php /YGGtracker/src/crontab/scrape.php      > /dev/null 2>&1
* * * * * /usr/bin/php /YGGtracker/src/crontab/export/push.php > /dev/null 2>&1
0 5 * * * /usr/bin/php /YGGtracker/src/crontab/import/feed.php > /dev/null 2>&1
0 0 * * * /usr/bin/php /YGGtracker/src/crontab/export/feed.php > /dev/null 2>&1
0 0 * * * /usr/bin/php /YGGtracker/src/crontab/sitemap.php     > /dev/null 2>&1

После завершения конфигурации, можно вручную загрузить данные публичных профилей из других узлов:

php /YGGtracker/src/crontab/import/feed.php

Для эффективного обмена данными с другими участниками сети YGGtracker, также можно добавить свой узел в файл /src/config/nodes.json

Дополнительные сервисы

Чтобы сбалансировать нагрузку на экосистему Yggdrasil при активном обмене файлами, не лишним будет организовать и использовать ориентированный на это публичный пир, а также добавить его в файл /src/config/peers.json.

О том, как настроить собственный торрент-трекер, описано в статье Opentracker.

Ссылки

Индексная страница проекта