
В данной заметке хочу оставить пару комментариев к примеру работы с файловой системой /proc из вышеприведенного мануала. Во время познания материала обнаружил некоторые несостыковки и вещи не совсем поясненные до конца, так что тут попытаюсь внести немного больше ясности для тех, кто начнет топать этим путем.
А почему?
Изучая программирование модулей ядра Linux, познавая (ИМХО, хороший) труд "The Linux Kernel Module Programming Guide" заметил несколько несостыковок при впитывании информации в разделе 7 "Файловая система /proc".
Сразу поясню: так как напрятаться было лень читал книжку в переводе от команды RUVDS (за что им большое спасибо), но перевод, кажется, стар, поэтому параллельно всматривался в оригинал, датируемый "May 2, 2023" - вроде бы как свежак). Условимся, что далее по тексту "RU" будет означать переведенную версию, "EN" - оригинал.
За что зацепился?
Ниже привожу код с примером "procfs3.c", как он есть в RU.
#include <linux/kernel.h> #include <linux/module.h> #include <linux/proc_fs.h> #include <linux/sched.h> #include <linux/uaccess.h> #include <linux/version.h> #if LINUX_VERSION_CODE >= KERNEL_VERSION(5, 6, 0) #define HAVE_PROC_OPS #endif #define PROCFS_MAX_SIZE 2048 #define PROCFS_ENTRY_FILENAME "buffer2k" static struct proc_dir_entry *our_proc_file; static char procfs_buffer[PROCFS_MAX_SIZE]; static unsigned long procfs_buffer_size = 0; static ssize_t procfs_read(struct file *filp, char __user *buffer, size_t length, loff_t *offset) { static int finished = 0; if (finished) { pr_debug("procfs_read: END\n"); finished = 0; return 0; } finished = 1; if (copy_to_user(buffer, procfs_buffer, procfs_buffer_size)) return -EFAULT; pr_debug("procfs_read: read %lu bytes\n", procfs_buffer_size); return procfs_buffer_size; } static ssize_t procfs_write(struct file *file, const char __user *buffer, size_t len, loff_t *off) { if (len > PROCFS_MAX_SIZE) procfs_buffer_size = PROCFS_MAX_SIZE; else procfs_buffer_size = len; if (copy_from_user(procfs_buffer, buffer, procfs_buffer_size)) return -EFAULT; pr_debug("procfs_write: write %lu bytes\n", procfs_buffer_size); return procfs_buffer_size; } static int procfs_open(struct inode *inode, struct file *file) { try_module_get(THIS_MODULE); return 0; } static int procfs_close(struct inode *inode, struct file *file) { module_put(THIS_MODULE); return 0; } #ifdef HAVE_PROC_OPS static struct proc_ops file_ops_4_our_proc_file = { .proc_read = procfs_read, .proc_write = procfs_write, .proc_open = procfs_open, .proc_release = procfs_close, }; #else static const struct file_operations file_ops_4_our_proc_file = { .read = procfs_read, .write = procfs_write, .open = procfs_open, .release = procfs_close, }; #endif static int __init procfs3_init(void) { our_proc_file = proc_create(PROCFS_ENTRY_FILENAME, 0644, NULL, &file_ops_4_our_proc_file); if (our_proc_file == NULL) { remove_proc_entry(PROCFS_ENTRY_FILENAME, NULL); pr_debug("Error: Could not initialize /proc/%s\n", PROCFS_ENTRY_FILENAME); return -ENOMEM; } proc_set_size(our_proc_file, 80); proc_set_user(our_proc_file, GLOBAL_ROOT_UID, GLOBAL_ROOT_GID); pr_debug("/proc/%s created\n", PROCFS_ENTRY_FILENAME); return 0; } static void __exit procfs3_exit(void) { remove_proc_entry(PROCFS_ENTRY_FILENAME, NULL); pr_debug("/proc/%s removed\n", PROCFS_ENTRY_FILENAME); } module_init(procfs3_init); module_exit(procfs3_exit); MODULE_LICENSE("GPL");
Первое, что ввело смуту - функция "procfs_read". Получается, чтобы прочитать, например, cat-ом нужно этот самый cat вызвать 2 раза для обновления статической переменной (напомню, 0 возвращается в этой функции, когда чтение закончено, а тут 0 вернется на 2-й вызов).
Честно говоря, при вызове "procfs_write" не очень понятно, почему меняется именно внутренняя переменная "procfs_buffer_size", а не пользовательский "len".
И убило меня применение "remove_proc_entry". Убило, потому чтобуквально в предыдущем примере вроде бы как для тех же вещей было использовано "proc_remove".
Решил заглядуть в EN.
А что там в EN?
Заглянув в оригинал я понял, что он действительно посвежее и доработаннее:
#include <linux/kernel.h> #include <linux/module.h> #include <linux/proc_fs.h> #include <linux/sched.h> #include <linux/uaccess.h> #include <linux/version.h> #if LINUX_VERSION_CODE >= KERNEL_VERSION(5, 10, 0) #include <linux/minmax.h> #endif #if LINUX_VERSION_CODE >= KERNEL_VERSION(5, 6, 0) #define HAVE_PROC_OPS #endif #define PROCFS_MAX_SIZE 2048UL #define PROCFS_ENTRY_FILENAME "buffer2k" static struct proc_dir_entry *our_proc_file; static char procfs_buffer[PROCFS_MAX_SIZE]; static unsigned long procfs_buffer_size = 0; static ssize_t procfs_read(struct file *filp, char __user *buffer, size_t length, loff_t *offset) { if (*offset || procfs_buffer_size == 0) { pr_debug("procfs_read: END\n"); *offset = 0; return 0; } procfs_buffer_size = min(procfs_buffer_size, length); if (copy_to_user(buffer, procfs_buffer, procfs_buffer_size)) return -EFAULT; *offset += procfs_buffer_size; pr_debug("procfs_read: read %lu bytes\n", procfs_buffer_size); return procfs_buffer_size; } static ssize_t procfs_write(struct file *file, const char __user *buffer, size_t len, loff_t *off) { procfs_buffer_size = min(PROCFS_MAX_SIZE, len); if (copy_from_user(procfs_buffer, buffer, procfs_buffer_size)) return -EFAULT; *off += procfs_buffer_size; pr_debug("procfs_write: write %lu bytes\n", procfs_buffer_size); return procfs_buffer_size; } static int procfs_open(struct inode *inode, struct file *file) { try_module_get(THIS_MODULE); return 0; } static int procfs_close(struct inode *inode, struct file *file) { module_put(THIS_MODULE); return 0; } #ifdef HAVE_PROC_OPS static struct proc_ops file_ops_4_our_proc_file = { .proc_read = procfs_read, .proc_write = procfs_write, .proc_open = procfs_open, .proc_release = procfs_close, }; #else static const struct file_operations file_ops_4_our_proc_file = { .read = procfs_read, .write = procfs_write, .open = procfs_open, .release = procfs_close, }; #endif static int __init procfs3_init(void) { our_proc_file = proc_create(PROCFS_ENTRY_FILENAME, 0644, NULL, &file_ops_4_our_proc_file); if (our_proc_file == NULL) { remove_proc_entry(PROCFS_ENTRY_FILENAME, NULL); pr_debug("Error: Could not initialize /proc/%s\n", PROCFS_ENTRY_FILENAME); return -ENOMEM; } proc_set_size(our_proc_file, 80); proc_set_user(our_proc_file, GLOBAL_ROOT_UID, GLOBAL_ROOT_GID); pr_debug("/proc/%s created\n", PROCFS_ENTRY_FILENAME); return 0; } static void __exit procfs3_exit(void) { remove_proc_entry(PROCFS_ENTRY_FILENAME, NULL); pr_debug("/proc/%s removed\n", PROCFS_ENTRY_FILENAME); } module_init(procfs3_init); module_exit(procfs3_exit); MODULE_LICENSE("GPL");
Тут видно, что "procfs_read" обрабатывается более правильнее, да и в целом код цивилизованнее - обрабатывает некоторые ситуация, проверки всякие добавлены.
Казалось бы - бинго! На это можно остановиться! Проблема старой версии! Но терзавший меня "remove_proc_entry" все еще уверенно сияет в исходном коде без всяких пояснений от авторов.
proc_remove vs remove_proc_entry
Ничего не понял, полез на википедию... И действительно, каким-то немыслимым футуристичным образом нашел доку, где есть фраза:
Deprecated create_proc_entry.
Note that the above article uses create_proc_entry which was removed in kernel 3.10. Current versions require the following update:
- entry = create_proc_entry("sequence", 0, NULL); - if (entry) - entry->proc_fops = &ct_file_ops; + entry = proc_create("sequence", 0, NULL, &ct_file_ops);
Больше ничего дельного не увидел (наверное мало искал, надеюсь, кто-то умный подскажет что-то более конкретное).
Так как я глуп и неопытен, то связал "create_proc_entry" & "remove_proc_entry", как 1й, "depricated" интерфейс для создания/удаления точки входа в /proc, а "proc_create" & "proc_remove", как 2-й, более свежий.
Кто такой этот proc_set_size?
Вернее, кто это такой - очень даже понятно, установка размера файла в /proc. Но для чего она нужна?
Итак, пусть в функции "procfs3_init", как в примере EN, будет установлен размер файла, равный 80, тогда в выводе "ls -lah /proc/procfs_3_note" будет явно указан этот заданный размер файла. Но на что он влияет?
Попробуем провести эксперимент. Скомпилируем программу с размером файла = 1 и установим модуль ядра.
user$ ls -lah /proc/procfs_3_note -rw-rw-rw- 1 root root 1 июн 22 14:29 /proc/procfs_3_note
Размер файла = 1, но, как и следовало ожидать запись и чтение ограничено только внутренним буфером:
user$ echo 0123456789 > /proc/procfs_3_note user$ cat /proc/procfs_3_note 0123456789
Т.е. размер файла влияет совсем не на это. Как сказал @jcmvbkbc(мерси):
Для того, чтобы дать возможность обращаться к файлу из /proc с ненулевого смещения...
Окей, попробуем. Рекомпиляем проект под размер 10 байт, загружаем вводим эхом последовательность 0123456789.
Напомню как выглядели функции записи/чтения по состоянию на 21.06
static ssize_t procFileRead( struct file *pFile, char __user *buffer, size_t bufLen, loff_t *offset ) { enum { END_OF_READING = 0 }; // Обработка случая окончания чтения if( *offset >= procfsBufferSize || 0 == procfsBufferSize ) { LOG("procFileRead: end of reading"); return END_OF_READING; } if( bufLen > procfsBufferSize ) { bufLen = procfsBufferSize; } // Передача данных между пространствами пользователя и ядра if( copy_to_user( buffer, procfsBuffer, bufLen ) ) { return -EFAULT; } LOG( "procFileRead: read %lu bytes", bufLen ); *offset += bufLen; return bufLen; } static ssize_t procFileWrite( struct file *pFile, const char __user *buff, size_t len, loff_t *off) { if( len > MAX_FILE_SIZE ) { len = MAX_FILE_SIZE; LOG( "procFileWrite: file is truncated to %lu bytes", len ); } else { LOG( "procFileWrite: writing %lu bytes...", len ); } // Передача данных между пространствами пользователя и ядра if( copy_from_user( procfsBuffer, buff, len ) ) { return -EFAULT; } *off += len; // Обновление размера внутреннего буфера procfsBufferSize = len; LOG( "procFileWrite: writing done!" ); return len; }
Пытаемся считать первые пару байт:
user$ hexdump /proc/procfs_3_note -C -n 2
Все хорошо, теперь считаем из середины.
user$ hexdump /proc/procfs_3_note -C -s 4 -n 2 00000004 30 31 |01| 00000006
Упс.. Кажется что-то не то. Адреса (колонка слева) изменены, но данные остались те же. Дело в том, что параметр -s утилиты hexdump позволяет задать смещение относительно начала файла для чтения. Этот параметр в функцию модуля ядра поступает, как offset/off в примере выше, но, если вглядеться, то видно, что в коде изменяются значения сдвигов, но сами значения не влияют на функции передачи данных в/из юзерленд/а. Исправим:
static ssize_t procFileRead( struct file *pFile, char __user *buffer, size_t bufLen, loff_t *offset ) { enum { END_OF_READING = 0 }; // Обработка случая окончания чтения if( *offset >= procfsBufferSize || 0 == procfsBufferSize ) { LOG("procFileRead: end of reading"); return END_OF_READING; } // При сдвиге размер "меньше" const unsigned truncSize = procfsBufferSize - *offset; if( bufLen > truncSize ) { bufLen = truncSize; } // Передача данных между пространствами пользователя и ядра if( copy_to_user( buffer, procfsBuffer + *offset, bufLen ) ) { LOG("procFileRead: ERROR copy_to_user "); return -EFAULT; } LOG( "procFileRead: read %lu bytes", bufLen ); *offset += bufLen; return bufLen; } static ssize_t procFileWrite( struct file *pFile, const char __user *buff, size_t len, loff_t *off) { // При сдвиге размер "меньше" const unsigned truncSize = MAX_FILE_SIZE - *off; if( len > truncSize ) { len = truncSize; LOG( "procFileWrite: file is truncated to %lu bytes", len ); } else { LOG( "procFileWrite: writing %lu bytes...", len ); } // Передача данных между пространствами пользователя и ядра if( copy_from_user( procfsBuffer + *off, buff, len ) ) { LOG("procFileRead: ERROR copy_from_user "); return -EFAULT; } *off += len; // Обновление размера внутреннего буфера procfsBufferSize = *off; LOG( "procFileWrite: writing done!" ); return len; }
Тестим, теперь похоже на правду:
user$ echo 0123456789 > /proc/procfs_3_note user$ hexdump /proc/procfs_3_note -C -s 4 -n 2 00000004 34 35 |45| 00000006
Но все же разбираться начали с proc_set_size. (Напомню, сейчас установлен в 10)
Попробуем установить сдвиг > 10:
user$ hexdump /proc/procfs_3_note -C -s 11 0000000a
Пусто) Заглянем в лог и видим, что функция чтения даже не была вызвана:
user$ sudo dmesg | grep procfs_ ... [26859.362492] procfs_3_note: procfsOpen [26859.362568] procfs_3_note: procfsClose
Судя по всему, стоит передавать в proc_set_size размер внутреннего буфера, по крайней мере в тривиальных случаях.
Итог
После всех поисков и разбирательств, написал модуль по образу и подобию вышеуказанных, но с добавлением некоторых комментариев и исправлений, которых нехватало мне. Может быть когда-то кому-то это чем-то поможет, спасибо.
