Асинхронный веб, или Что такое веб-сокеты

В этой статье речь пойдёт о протоколе WebSocket, немного теории и реализация его в браузере через JavaScript и на сервере на «голом» php.

Оглавление

Общая информация о веб-сокетах

Веб-сокеты, это такая технология, которая позволяет браузеру и серверу создать одно постоянное соединение и через него обмениваться данными.

Веб-сокеты

Преимущества такого подхода в том что для отслеживания изменения на сайте, браузеру теперь нет необходимости постоянно «сыпать» запросы на сервер. При постоянном соединении сервер теперь может когда ему надо отправить сообщение браузеру, т.е. связь двунаправленная, от браузера к серверу и от сервера к браузеру.

Рассмотрим классическую схему уведомления о сообщениях на сайте. Когда пользователь авторизуется на сайте, браузер каждый 30 секунд (может и чаще) шлёт ajax-запрос на сайт, по определённому урлу. Запрос типа — «Пришли ли мне новые сообщения». Сервер в большинстве случаев будет отвечать «Сообщений новых нет», и только изредка долгожданное «У вас 1 новое сообщение». Когда пользователей не много такая схема устраивает, но когда их много сервер получает до 1000 и более безсмысленных запросов. Такая схема использовалась, потому что http построен по принципу сделал запрос, получил ответ и «давай до свидание». В http нет возможности отправить сообщение от сервера браузеру, если браузер не спросит. При схеме с веб-сокетами браузеру достаточно создать соединение и ждать, сервер сам ответит браузеру, когда нужно. Преимущество на лицо — значительно снижается трафик и нагрузка на сервер, и уведомление приходит моментально. Широта использования веб-сокетов велика: чаты, уведомления, «доставучие» online-консультанты и прочее.

Реализация клиента на Javascript

Протокол веб-сокет создан уже давно (приобрёл статус RFC в 11.12.2011) и поддерживается большинством браузеров. Чтобы узнать поддерживает ли ваш браузер веб-сокеты перейдите по ссылке.

Работа в браузерах с вебсокетам проходит в несколько этапов:

  • Установка соединения или рукопожатие (handshake).
  • Создание обработчиков событий: onopen (соединение создано), onclose(соединение закрыто), onmessage (пришло сообщение от сервера), onerror (ошибка при работе веб-сокетов).
  • Отправка сообщений (фреймов) на сервер.

Тестировать веб-сокеты мы будем на сервере websocket.org «ws://echo.websocket.org», который будет принимать от нас сообщения и отвечать на них повторением сообщением. Этот сайт как раз существует, что лучше понять веб-сокеты, он понимает кросс-доменные запросы, поэтому страницу с JavaScript будем размещать у себя на локальном компьютере.

Этап. Рукопожатие

Чтобы создать соединение по веб-сокету достаточно создать объект WebSocket, в котором указывается урл для подключения.

Используйте протокол «ws://», если нужно не шифрованное соединение или протокол «wss://» для шифрованного соединения.

Этап. Создание обработчиков событий.

После того как мы создали объект WebSocket необходимо повесить функции-обработчики на события.

Если нужно повесить несколько функций на событие используем методы «addEventListener» и «removeEventListener». Пример:

Этап. Отправка сообщений на сервер

По веб-сокету сообщения отправляются в виде строки. Пример отправки простого текстового сообщения.

Обработка приходящих данных лежит уже на стороне сервера. Чаще для удобства работы по вебсокету отправляют JSON данные серилизованные в строку и обрабатывают приходящие данные как строка в JSON-e. Пример использования:

Удобный способ отправки сообщений по веб-сокету служит протокол «JSON-RPC» (ссылка). Это очень простой протокол, который облегчит взаимодействие браузера и сервера. Пример использования JSON RPC:

Параметры json-rpc объекта:

  • jsonrpc — версия протокола, может быть «2.0» или «1.0»
  • id — идентификатор запроса. Используется для идентификации ответа от сервера по своем запросу. Т.е. если отправить два запроса, то ответ от сервера по каждому запросу прийдёт в разное время, для этого и нужен id. На сервере необходимо учитывать этот параметр и в ответ прислать именно нужный id.
  • method — наименование метода, любая строка, к примеру «get», «hello», «set» и др.
  • params — параметры связанные с этим методом, тип переменной может быть любой, всё зависит от сервера.

Чтобы закрыть соединение используем метод close().

Протокол WebSocket

Рукопожатие. Запрос браузера

Работа с веб-сокетами идёт в два этапа, сначала браузер отправляет серверу по HTTP протоколу запрос, за соединение (handshake — рукопожатие). Запрос выглядит примерно так:

в котором обязательно должы присутствовать эти заголовки:

  • GET, Host — стандартные заголовки
  • Connection, Upgrade — браузер хочет перейти на новый протокол
  • Origin — адрес с которого отправлен запрос. Мы можем это учитывать или нет.
  • Sec-WebSocket-Key — случайный ключ, который генерируется браузером в кодировке Base64, нужен чтобы понять, что ответ от сервера на подключение предназначен именно ему.
  • Sec-WebSocket-Version — версия протокол. Последняя версия 13.

Также есть дополнительные заголовки:

  • Sec-WebSocket-Extensions — расширения протокола, которые поддерживает браузер, можно указать несколько через точку с запятой. Если сервер поддерживает эти расширения, он должен ответить ответным заголовком с этим расширением. Например если указано «permessage-deflate» (сжимать фреймы по алгоритму Deflate), то в ответном сообщении, будет строка «Sec-WebSocket-Extensions: permessage-deflate». Походу только одно расширение. Подробнее тут.
  • Sec-WebSocket-Protocol — протокол по которому будет браузер отсылать данные.

    Т.к. по websocket-у можно отсылать любые данные в виде строки, указание протокола поможет легче парсить приходящие данные. Увы «JSON RPC» тут нету, зато есть куча других, например: soap, wamp и др., подробнее тут.

Рукопожатие. Ответ сервера

Для начала сообщим браузеру, что сервер понимает WebSocket-протокол. Для это отправим ответное сообщение:

В сообщении символ новой строки должен быть в Windows-стиле (\r\n), а в конце сообщения должно быть две новые строки (\r\n\r\n). Заголовок «Sec-WebSocket-Accept» вычисляется в зависимости от заголовка «Sec-WebSocket-Key» присланного браузером, порядок получения его таков:

  • Соединяем «Sec-WebSocket-Key» со строкой «258EAFA5-E914-47DA-95CA-C5AB0DC85B11», это строка прописана в RFC 6455 для веб-сокетов.
  • Далее вычисляем бинарный SHA1 по полученной строке.
  • И наконец кодируем строку алгоритмом base64.

В PHP вычисление «Sec-WebSocket-Accept» будет выглядит так:

Отправка сообщений

После того как браузер получает ответ, устанавливается постоянное TCP-соединение и обмен сообщениями между сервером и браузером осуществляется по бинарному протоколу ничего общего с HTTP не имеющего. Бинарные сообщения, которые пересылаются по этому протоколу именуют ещё «фреймами» (frame).

Формат фрейма по 32 бита, как в RFC.

Формат фрейма по 16 бит.

Разберём первые 16 бит фрейма (далее заголовок фрейма):

  • Флаг FIN — Браузер может посылать сообщение частями, т.е. сообщение будет из несколько фреймов. Если фрейм фрагментированный, у всех фреймов кроме последнего будет 0, а у последнего 1. Если сообщение не фрагмантировано то флаг всегда будет в 1.
  • Флаги RSV1, RSV2, RSV3 почти всегда в 0, предназначены для расширений протокола.
  • Опкод — шестнадцатеричное число, указывает тип фрейма:
    • 0x1 — текстовой фрейм.
    • 0x2 — двоичный фрейм.
    • 0x3 — 0x7 — не используются, зарезервированы.
    • 0x8 — фрейм закрытия соединения
    • 0x9 — фрейм PING
    • 0xA — фрейм PONG.
    • 0xB — 0xF — не используются, зарезервированы.
    • 0x0 — обозначает фрейм-продолжение для фрагментированного сообщения
  • Флаг маски — если 1 то фрейм замаскирован
  • Длина сообщения — предварительная длина сообщения.

Длина сообщения указывается в байтах и вычисляется по схеме (ну и намудрили):

  • Если длина сообщения в заголовке фрейма 125 и ниже, то длина сообщения будет как указано в заголовке
  • Если длина сообщения в заголовке фрейма равна 126, то длиной сообщения будет следующии за заголовком 16 бит
  • Если длина сообщения в заголовке фрейма равна 127, то длиной сообщения будет следующии за заголовком 64 бита

Маска используется для того чтобы замаскировать сообщение. Маска используется для защиты от атаки отравленый кэш.

Фрейм может быть замаскирован, а может быть и нет:

  • Фрейм поступающий от браузера может быть замаскирован, а может быть и нет.
  • Фрейм поступающий от сервера должен быть не замаскирован (хотя некоторые браузеры понимают замаскированные фреймы).

Если фрейм замаскирован, то флаг маски установливается в 1 и следующие 32 бита (4 байта) будет маска, а строка сообщения будет XOR закодировано. Это значит что над каждым байтом в сообщении будет выполнено побитовая операция «исключающее или» с байтом из маски. В PHP для это используется символ «^». Работает это примерно так «z» ^ «m» ^ «m» === «z». Пример на PHP:

Текст сообщения должен быть в кодировке UTF-8.

Примеры сообщений.

Реализация сервера на PHP

Исходники простого WebSocket echo-сервера выложил сюда. Код хорошо документирован, но я всё же опишу некоторые тонкости реализации. Чтобы «поднять» WebSocket сервер нужно создать обычный TCP-сервер. В PHP TCP-сервер реализуется через «stream_socket» или через PHP расширение «sockets». Различия между ними в том, что «stream_socket» работает на встроенных функциях PHP для работы с потоками, «sockets» же работает через модуль PHP и повторяет функции для работы с сокетами в языке «C». Я выбрал «sockets».

Процесс реализован через «while» с задержкой 0.2 секунды. Процесс не форкается и сообщения выбрасывает в консоль, поэтому запускать необходимо только через консоль. Для того, чтобы обслуживать несколько клиентов одновременно, сокет делаю неблокирующим и через «socket_select» каждые 0.2 секунды прослушиваю сокет. При рукопожатии проверяю только наличие заголовков.

Фреймы парсю через «pack/unpack». Сервер не понимает фрагментированных фреймов. Сервер выдаёт только незамаскированные сообщения, т.к. некоторые браузеры не понимают замаскированных сообщений. Сервер реагирует только на текстовые фреймы и фрейм закрытия соединения, бинарные фреймы не понимает.

Ну собственно всё, удачи в исследовании этого не простого протокола.

Источники:

вебсокет, websocket, php, javascript, вебсокет фреймы, маскировка сообщения

Вся правда о WebSocket

.

Асинхронный веб, или Что такое веб-сокеты

.

Добавить комментарий

Закрыть меню