Знакомство
Привет! Меня зовут Наталья. В Каруне я пишу в команде высоконагруженные сервисы на Elixir.
Это третья компания, в которой я работаю на Elixir. До этого я писала на Ruby. Если посмотреть свежее исследование Хабр Карьеры по зарплатам, можно увидеть — зарплаты рубистов растут, а Elixir там нет. Более того, есть истории о том, как люди возвращались с Elixir обратно на Ruby. Я считаю, что на это сильно влияет вход в язык. Elixir классный, но в первые месяцы знакомства с ним мне самой так не казалось. Настолько классный, что я не хочу назад. В этой статье я расскажу про трудности перевода перехода.
Elixir is a functional programming language which looks similar to Ruby.
В IT сообществе существует мнение, что рубисты легко переходят на Elixir. Ещё бы — сам создатель языка Jose Walim в прошлом рубист. Не просто рубист, а core разработчик Ruby on Rails. Можно подумать, что Elixir — это Ruby после прокачки. Тебе будет так же удобно/быстро/классно писать на нём, плюсом идёт вся мощь Erlang’а. Мне в своё время очень нравился Ruby. И предложение перейти на Elixir казалось заманчивой перспективой.
Ruby |> Elixir
Изучая новую технологию, я стремлюсь как можно быстрее попробовать что-то сделать руками. Да, стоит зайти на сайт с документацией. Ознакомиться с синтаксисом. И быстрее в терминал, делать простые штуки.
После беглого знакомства с документацией в моей голове был примерно такой план перехода между языками. Оператор “|>” означает передачу результата выполнения одного выражения в следующее.
Ruby
|> remove_OOP()
|> add_some_functions()
|> save_TDD()
|> add_OTP()
|> save_syntactic_sugar()
{:ok, Elixir}
Кажется, достаточно простые шаги. Забываем про ООП. В стандартной библиотеке будут знакомые функции. Будет что-то новое. Но тесты никто не отменял. Есть целая новая реальность под названием Open Telecom Platform. Открываем VS Code.
%{a: 1} # map in Elixir
{a: 1} # hash in Ruby
# Lists
[1, 2, true, 3] # Elixir, Ruby
# Concatenate lists
[1, 2, true, 3] ++ [5, 7] # Elixir
[1, 2, true, 3] + [5, 7] # Ruby
# Calling function/method
String.reverce("hello") # Elixir
"hello".reverse # Ruby
# An anonymous function
fn(x) -> x * x end # ELixir
-> x {x * x} # lambda in Ruby
# Using each
Enum.each([1, 2], &(IO.puts &1)) # Elixir
[1, 2].each { |i| puts i } # Ruby
# Defining a function in Elixir
def hello do
"result"
end
# Defining a method in Ruby
def hello
"result"
end
# Defining a module in Elixir
defmodule Example do
end
# Defining a module in Ruby
module Example
end
Очень похоже. Подумаешь: вместо вызова метода у объекта мы вызываем функцию, указывая имя модуля.
Давайте сделаем что-нибудь полезное. Например, напишем модуль, который будет определять, является ли год високосным.
Ruby
class Year
def self.leap?(year)
@year = year
div_by?(4) && ( !div_by?(100) || div_by?(400) )
end
def self.div_by?(number)
@year % number == 0
end
end
Elixir
defmodule Year do
def leap?(year) do
div_by?(year, 4) && ( !div_by?(year, 100) || div_by?(year, 400) )
end
def div_by?(year, number) do
rem(year, number) == 0
end
end
В методы приходится пробрасывать год. Остаток от деления получается через функцию. Надо не забывать писать do при объявлении после названия модуля или функции.
Давайте теперь этот функционал потестируем и заодно посмотрим на фреймворк для тестов в Elixir. Он поставляется вместе с языком. Для полноты сравнения языков я беру со сторону Ruby minitest., т.к. со стороны Elixir у нас классическое Test Driven Development. Бывшие рубисты, естественно, наклепали уже себе espec. Он, правда, не особо прижился. Так что переучиться так или иначе придётся. Давайте посмотрим, насколько сильно — при условии, что minitest вы хоть раз видели. И помним о том, что мы тестируем утверждения.
Ruby
require 'minitest/autorun'
require_relative 'leap'
class YearTest < Minitest::Test
def test_year_not_divisible_by_4_common_year
# skip
refute Year.leap?(2015), "Expected 'false', 2015 is not a leap year."
end
def test_year_divisible_by_4_not_divisible_by_100
assert Year.leap?(1996), "Expected 'true', 1996 is a leap year."
end
def test_year_divisible_by_100_not_divisible_by_400
refute Year.leap?(2100), "Expected 'false', 2100 is not a leap year."
end
def test_year_divisible_by_400
assert Year.leap?(2000), "Expected 'true', 2000 is a leap year."
end
def test_year_divisible_by_200_not_divisible_by_400
# skip
refute Year.leap?(1800), "Expected 'false', 1800 is not a leap year."
end
end
Elixir
Code.load_file("leap.exs", __DIR__)
ExUnit.start()
ExUnit.configure(exclude: :pending, trace: true)
defmodule LeapTest do
use ExUnit.Case
test "2015 year not divisible by 4" do
refute Year.leap?(2015)
end
# @tag :pending
test "1996 year divisible by 4 not divisible by 100 leap year" do
assert Year.leap?(1996)
end
test "2100 year divisible by 100 not divisible by 400" do
refute Year.leap?(2100)
end
test "2000 year divisible by 400 leap year" do
assert Year.leap?(2000)
end
test "1800 year divisible by 200 not divisible by 400" do
refute Year.leap?(1800)
end
end
Снова отличия, кроме уже названных, не так уж велики. Скипать тесты можно, это делается через кастомный тэг. Достаточно его указать в конфигурации как исключающий: “exclude: :pending”.
В этот момент появляется мысль…
Ruby on Rails |> Phoenix
С языком было легко, давайте посмотрим, что там с фреймворками. В кратком изложении я для себя это собрала в таком виде:
Rails controller == Phoenix controller (in Context)
Rails model =~ Ecto (Schema + Repo + Query + ...)
Rails view (template) =~ Phoenix view + template
Rails serializer == Phoenix view
Rails seeds/tasks =~ Phoenix seeds/tasks
Rails migrations =~ Ecto migrations
Rails console != Phoenix console
Покажу подробнее те аспекты, в которых наибольшие различия.
Миграции
Заходим в консоль и смотрим доступные действия с миграциями.
Ruby
rails db:migrate
rails db:rollback
rails db:rollback STEP=2
rails db:migrate VERSION=20181213084911
rails db:migrate:redo VERSION=20181213084911
rails db:migrate:up VERSION=20181213084911
rails db:migrate:down VERSION=20181213084911
Elixir
mix ecto.migrate
mix ecto.migrate -r Custom.Repo
mix ecto.migrate -n 3
mix ecto.rollback
mix ecto.rollback --step 2
mix ecto.migrate -to 20181213084911
mix ecto.rollback -to 20181213084911
# What?!
Ожидаемо мы можем накатывать и откатывать миграции на некоторое количество шагов. Неожиданно появляется какой-то кастомный Repo. Нельзя откатить или накатить конкретную миграцию через вызов таски. Только пачку миграций, друг за другом — до указанной версии.
Если покопаться в API Ecto, то через выполнение кода в принципе можно...
Ecto.Migrator.with_repo(your_repo, &Ecto.Migrator.run(&1, :down, to: version))
Что это за Repo, посмотрим дальше.
Взаимодействие с базой
Это вторая вещь, которая максимально выбивает из колеи. Первая — сама функциональная парадигма. Дело в том, что как мир веб разработки пропитан ООП, так и общение с базой в мире ООП означает повсеместное использование ORM. В Rails мы обращаемся с записью из БД как с объектом с помощью Active Record. Забывая, что под капотом это просто данные. При знакомстве с языком Elixir мы уже утратили часть объектно-ориентированного взгляда на мир. Приходит время утратить его до конца (по возможности). На сцену выходит Ecto. Первое, что нужно уложить в голове: Ecto — это data mapper + query builder DSL.
Active Record is ORM, gives us:
- models and their data
- associations between models
- models validation
- database operations in an object-oriented style
Ecto differs from other ORMs:
- schemas and their data
- associations between schemas
- changeset with validations
- database operations in functional style with Ecto modules (Repo, Query, etc.)
Модель превратилась в схему данных. Ассоциации никуда не делись. Чтобы увидеть, из каких полей состоит таблица, больше не надо куда-то ходить. Схема описывает доступные поля таблицы. Есть любопытный нюанс: схема не обязана описывать все поля. Схемой мы ограничиваем подмножество полей таблицы, с которым хотим работать. Зачем? Я могу придумать только пару примеров:
1. Какое-то поле стало нельзя менять, но оно ещё используются другими клиентами/приложениями. Такое поле можно убрать из схемы, но оставить в БД.
2. Разные наборы полей для разных контекстов. Разные подмножества полей используются в разных контекстах приложения.
Возможно, оба примера покажутся синтетическими — я открыта для ваших примеров, предлагайте, пожалуйста, в комментариях.
Ruby
class OnlineTracking < ActiveRecord::Base
belongs_to :startup
belongs_to :expert, class_name: 'User'
has_one :expert_startup_rate, class_name: 'ExpertAnketa::StartupRate', dependent: :destroy
has_many :slots, class_name: 'OnlineTracking::Slot', foreign_key: :online_tracking_id
validates :startup_id, presence: true
validates :start_at, presence: true
validates :weeks, presence: true, numericality: { only_integer: true }
enum pause_status: {
disabled: 0, # отключение
date_changed: 1, # перенос
}
after_create :make_anketas
after_update :update_startup_leads, if: Proc.new { |ot| ot.finished_at.present? || ot.deleted? }
Валидации находятся внутри схемы, но отвечает за них changeset (Ecto.Changeset). Что это означает? Changeset — дополнительное ограничение подмножества полей, с которыми вы хотите работать. Подмножество от подмножества от подмножества… Дело в том, что поля нельзя изменить НЕ через changeset. Хотя стоит сделать оговорку: технически можно воспользоваться Repo.update_all/3, либо выполнить чистый SQL-запрос. Но на мой взгляд лучше пойти в обход.
Отсутствие прямой возможности изменений кажется странным — но ровно до того момента, когда узнаешь, что у схемы может быть несколько changeset’ов. Самый простой пример, почему удобно использовать такую конструкцию — таблица пользователей. При создании пользователя мы заполняем большинство полей, а при редактировании не хотим давать доступ ко всему подряд. Для ряда пользователей часть полей могут быть недоступными для изменений всегда (собственная роль, например). Сколько потребностей по ограничениям — столько changeset’ов понадобится. Смена пароля, смена email, редактирование профиля, создание пользователя — разные формы, разные changeset’ы. Ещё одно удобство в том, что внутри changeset’а используются только нужные валидации. Те. только те, которые касаются изменяемых полей — в то время как типичная модель ActiveRecord по мере развития проекта превращается в нагромождение валидаций и callback’ов. В этом хаосе очень сложно разбираться. Модель может выполнять различные действия: отправлять два вида нотификаций, считать промежуточные баллы, выдавать результат сложного запроса для отчётов…
Давайте посмотрим, как Phoenix позволяет разделить работу с данными по слоям.
Elixir
defmodule App.Accounts.User do
use Ecto.Schema
import Ecto.Changeset
alias Ecto.Changeset
alias App.Accounts.User
alias App.CompanyManagement.Employee
alias App.EmailType
alias App.Repo
@required [:email, :password]
@optional [:type]
schema "users" do
field :email, EmailType
field :password, :string, virtual: true
field :password_confirmation, :string, virtual: true
field :password_hash, :string
field :recovery_token, :string
field :refresh_token, :string
field :type, UserTypeEnum
has_one :employee, Employee
timestamps(type: :naive_datetime_usec)
end
@required_fields ~w(email)a
@optional_fields ~w()a
def changeset(%User{} = user, attrs) do
user
|> cast(attrs, @required_fields ++ @optional_fields)
|> validate_required(@required_fields)
|> unique_email()
end
def email_changeset(%User{} = user, attrs) do
user
|> cast(attrs, [:email])
|> unique_email()
end
def create_changeset(%User{} = user, attrs) do
user
|> cast(attrs, @required ++ @optional)
|> validate_required(@required)
|> unique_email()
|> unique_constraint(:id, name: :users_pkey)
|> validate_password(:password)
|> put_pass_hash()
end
def recovery_changeset(%User{} = user, %{"password" => password}) do
user
|> change(%{recovery_token: nil, refresh_token: nil, password: password})
|> validate_password(:password)
|> put_pass_hash()
end
Помимо changeset’а и схемы User для совершения манипуляций с таблицей нам понадобится Repo. Модуль адаптер — репозиторий для взаимодействия с конкретной базой.
defmodule App.Accounts.UserQueries do
alias App.Accounts.User
alias App.Repo
def create(attrs \\ %{}) do
%User{}
|> User.create_changeset(attrs)
|> Repo.insert()
end
def update(%User{} = user, attrs) do
user
|> User.changeset(attrs)
|> Repo.update()
end
def delete(%User{} = user) do
Repo.delete(user)
end
def update_refresh_token(%User{} = user, refresh_token) do
user
|> User.refresh_token_changeset(%{refresh_token: refresh_token})
|> Repo.update()
end
end
Как видно из примеров, функций внутри схемы нет. Данные отдельно, действия с этими данными отдельно. С запросами на чтение данных ситуация поменялась. В Rails у нас скоупы внутри модели и возможность получать через точку ассоциации.
scope :finished, -> { where('finished_at is not null') }
scope :active, -> { where(active: true) }
scope :recommended, -> { where(status: OnlineTracking.statuses[:recommended]) }
scope :by_start_date, -> (date_from, date_to) { where('start_at BETWEEN ? AND ?', date_from, date_to) }
Ecto для простых запросов предлагает использовать уже знакомый нам Repo, а для более сложных — DSL под названием Ecto.Query.
defmodule App.Catalog.HouseQueries do
import Ecto.Query, warn: false
alias App.Repo
alias App.Catalog.House
alias App.Catalog.ResidentialComplex
def get(id), do: Repo.get(House, id)
def list(params, search_params \\ nil) do
list_query()
|> filter_city(search_params[:city_id])
|> Repo.paginate(params)
end
defp list_query() do
from h in House,
where: is_nil(h.archived_at),
preload: ^preload_list()
end
defp filter_city(query, nil), do: query
defp filter_city(query, city_id) do
from i in query,
join: r in ResidentialComplex,
where: i.residential_complex_id == r.id,
where: r.city_id == ^city_id
end
Возможность писать запросы на чистом SQL есть в обоих языках.
Получается, в Elixir нужно всё писать руками? Получается…
Пример реализации счётчика дочерних объектов внутри таблицы.
Ruby
class Book < ApplicationRecord
belongs_to :author, counter_cache: :count_of_books
end
Elixir
defmodule App.Catalog.ResidentialComplex
schema "residential_complexs" do
field :houses_count, :integer, default: 0
has_many :houses, Catalog.House
end
defmodule App.Catalog.House do
# schema
def changeset(house, attrs) do
house
|> cast(attrs, @required ++ @optional)
|> validate_required(@required)
|> prepare_changes(&complex_houses_count/1)
|> assoc_constraint(:residential_complex)
end
defp complex_houses_count(changeset) do
if complex_id = get_change(changeset, :residential_complex_id) do
if changeset.action == :update do
prev_complex_id = changeset.data.residential_complex_id
query = from Catalog.ResidentialComplex, where: [id: ^prev_complex_id]
changeset.repo.update_all(query, inc: [houses_count: -1])
end
query = from Catalog.ResidentialComplex, where: [id: ^complex_id]
changeset.repo.update_all(query, inc: [houses_count: 1])
end
changeset
end
What?!
Консоль
Ruby нам предоставляет irb, Elixir соответственно iex. И это был мой топ-1 в листе шока от использования. Давайте посмотрим. Запускаем консоль.
rails c
> OnlineTracking.find(409).update(active: false)
=> true
> ActiveRecord::Migration.drop_table(:experts_groups)
=> true
> OnlineTracking.last
> OnlineTracking.startup.user.name
iex -S mix
> Repo.get(ResidentialComplex, 1) |> Ecto.Changeset.change(houses_count: 0) |> Repo.update()
** (UndefinedFunctionError) function Repo.get/2 is undefined (module Repo is not available)
Repo.get(ResidentialComplex, 1)
> alias App.Repo
App.Repo
> Repo.get(ResidentialComplex, 1) |> Ecto.Changeset.change(houses_count: 0) |> Repo.update()
** (Protocol.UndefinedError) protocol Ecto.Queryable not implemented for ResidentialComplex, the given module does not exist.
This protocol is implemented for: Atom, BitString, Ecto.Query, Ecto.SubQuery, Tuple
> alias App.Catalog.ResidentialComplex
App.Catalog.ResidentialComplex
> Repo.get(ResidentialComplex, 1) |> Ecto.Changeset.change(houses_count: 0) |> Repo.update()
{:ok, %App.Catalog.ResidentialComplex}
> ResidentialComplex |> last() |> Repo.one()
А ведь я пытаюсь сделать элементарные вещи: обновить одно поле, получить одну запись.
Как с этим жить? Принять на веру:
Rails консоль говорит тебе: да, делай что хочешь.
Хочешь таблицу на живую из консоли удалить? Пожалуйста.
Хочешь пользователю возраст на проде поменять из консоли? Чего бы и нет, один update.
IEX говорит тебе: чти заповеди! Пока не выучишь, лучше не приходи.
Заповеди:
Кто ты, что тебе нужно? Я ничего о тебе не знаю. Любые модули, которые хочешь использовать, нужно позвать (через alias, import). Либо можно в корне проекта создать файл .iex.exs и там все часто используемые модули позвать заранее.
В базу ведут несколько ворот. Открывай те, которые нужны — используй модули (Repo, Query, Changeset).
Мы не дёргаем товарищей без нужды. Нельзя обратиться к ассоциации просто так. Сначала её нужно подгрузить через preload().
Смотри внимательно, что пишешь. По описанию ошибки бывает сложно понять, что ты опечатался.
RTFM.
Ошибки
Давайте посмотрим описания ошибок на примерах. Первый пример простой, второй со звёздочкой.
> alias App.Catalog.ResidentailComplex
App.Catalog.ResidentailComplex
> Repo.get(ResidentialComplex, 1)
** (Protocol.UndefinedError) protocol Ecto.Queryable not implemented for ResidentialComplex, the given module does not exist.
This protocol is implemented for: Atom, BitString, Ecto.Query, Ecto.SubQuery, Tuple
defmodule AppWeb.Catalog.ResidentialComplexView do
def render("show.json", residential_complex: complex) do
render_one(complex, ResidentialComplexView, "residential_complex.json")
end
Request: GET /api/complexes/2
** (exit) an exception was raised:
** (Phoenix.Template.UndefinedError) Could not render "show.json" for AppWeb.Catalog.ResidentialComplexView,
please define a matching clause for render/2 or define a template at "lib/app_web/templates/catalog/residential_complex".
No templates were compiled for this module.
В первом примере я позвала модуль, но ошиблась в названии. Буквы перепутала местами. А в запросе правильно написала, но получила ошибку — не знаем такого модуля.
Во втором примере кусок кода показывает описание вьюхи. Для того, чтобы отрендерить страницу, контроллер пойдёт через вьюху искать нужный шаблон. Во вьюхе мы подставляем данные. Можно эти данные подрезать или как-то по-другому пересобрать. По мне, очень удобно. Вот я вижу ошибку. Что там написано? Что никак нельзя отрендерить json, потому что внутри вьюхи моей нет подходящей функции render. Но она же есть. Вы же её тоже видите? Вьюха называется правильно, json называется правильно. Я в своё время голову себе сломала, пытаясь понять, что не так.
Предлагаю рубистам и любителям эликсира найти ошибку. Если никто не найдёт, позже сама в комментариях напишу.
Послесловие
The devil is in the details.
Переходя с одного языка на другой, можно побывать на всех стадиях принятия. Тезисы типа “Легче ли рубистам переходить, чем всем остальным” и “Лучше ли эликсир, чем руби” на мой взгляд не имеют смысла. Меня при переходе первое время многое раздражало. Прошло какое-то время, и вещи, которые казались избыточными, стали выглядеть правильными и красивыми. А какие-то штуки, которых не хватает, перестали быть проблемой.
Руби все ещё хорош и продолжает развиваться. Благодаря сильным командам на все ваши потребности найдутся подходящие либы. И даже на все косяки из коробки есть заплатки из коробки или даже какие-то альтернативы. К этому привыкаешь.
Эликсир хорош и развивается. Отсутствие нужных библиотек постепенно закрывается. В коде вещи делаются явно, а значит, возникает прозрачность. Есть всякие классные штуки из коробки, которые позволяют не тащить ничего дополнительного в проект ради background jobs, например. Документация красивая. И к этому тоже привыкаешь.
Мне бы хотелось донести две основные мысли.
При изучении нового языка желательно смотреть на него максимально чистым взглядом.
Отбросить свои знания других языков, особенно если наблюдаются какие-то синтаксические сходства. Это сложно. Но, в основном, психологически. Мой первоначальный план перехода преобразовался бы в такой:
Ruby
|> forget_OOP
|> undestand_functional_programming
|> use_TDD
|> be_ready_and_patient
|> RTFM
|> practice
|> practice
Oh! Elixir
Получив опыт на другом языке, появляется возможность пересмотреть то, как пишешь код на своём основном.
Покажу утрированный пример с Codewars. Все примеры кода написаны на руби.
Второй по красоте из рейтинга
def human_years_cat_years_dog_years(human_years)
cat_year = 15
dog_year = 15
if human_years == 1
human_cat_dog = [human_years, cat_year, dog_year]
end
if human_years == 2
cat_year += 9
dog_year += 9
human_cat_dog = [human_years, cat_year, dog_year]
end
if human_years > 2
cat_year += 9 + 4 * (human_years - 2)
dog_year += 9 + 5 * (human_years - 2)
human_cat_dog = [human_years, cat_year, dog_year]
end
human_cat_dog
end
Мой вариант
def human_years_cat_years_dog_years(human_years)
[human_years, cat_years(human_years), dog_years(human_years)]
end
def dog_years(years)
case years
when 1
15
when 2
24
else
24 + (years - 2) * 5
end
end
def cat_years(years)
case years
when 1
15
when 2
24
else
24 + (years - 2) * 4
end
end
Хм, а так ли обязательно накапливать результаты в переменных?
Первый по красоте вариант из рейтинга
def human_years_cat_years_dog_years(human_years)
cat_years=(human_years>=2)? 24+(human_years-2)*4:15
dog_years=(human_years>=2)? 24+(human_years-2)*5:15
return [human_years,cat_years,dog_years]
end
Это не значит, что нужно писать на руби в “функциональном стиле”. Но возможность задуматься, как именно вы делаете то, что делаете — всегда с вами.
Справедливости ради, после некоторого времени программирования на эликсире, пример с поиском високосного года стоит переписать вот так:
Elixir
defmodule Year do
def leap?(year) when rem(year, 400) == 0, do: true
def leap?(year) when rem(year, 100) == 0, do: false
def leap?(year) when rem(year, 4) == 0, do: true
def leap?(_year), do: false
end
Совсем другая выразительность.
Спасибо за внимание.