Qual è la differenza tra sezione e segmento nel formato di file ELF

Da wiki eseguibile e formato collegabile :

I segmenti contengono le informazioni necessarie per l’esecuzione runtime del file, mentre le sezioni contengono dati importanti per il collegamento e il trasferimento. Qualsiasi byte dell’intero file può essere posseduto al massimo da una sezione, e possono esserci byte orfani che non appartengono a nessuna sezione.

Ma qual è la differenza tra sezione e segmento? In un file ELF eseguibile, un segmento contiene una o più sezioni?

Ma qual è la differenza tra sezione e segmento?

Esattamente ciò che hai citato: i segmenti contengono le informazioni necessarie al runtime, mentre le sezioni contengono le informazioni necessarie durante il collegamento.

un segmento contiene una o più sezioni?

Un segmento può contenere 0 o più sezioni. Esempio:

readelf -l /bin/date Elf file type is EXEC (Executable file) Entry point 0x402000 There are 9 program headers, starting at offset 64 Program Headers: Type Offset VirtAddr PhysAddr FileSiz MemSiz Flags Align PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040 0x00000000000001f8 0x00000000000001f8 RE 8 INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238 0x000000000000001c 0x000000000000001c R 1 [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2] LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000 0x000000000000d5ac 0x000000000000d5ac RE 200000 LOAD 0x000000000000de10 0x000000000060de10 0x000000000060de10 0x0000000000000440 0x0000000000000610 RW 200000 DYNAMIC 0x000000000000de38 0x000000000060de38 0x000000000060de38 0x00000000000001a0 0x00000000000001a0 RW 8 NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254 0x0000000000000044 0x0000000000000044 R 4 GNU_EH_FRAME 0x000000000000c700 0x000000000040c700 0x000000000040c700 0x00000000000002a4 0x00000000000002a4 R 4 GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 RW 8 GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10 0x00000000000001f0 0x00000000000001f0 R 1 Section to Segment mapping: Segment Sections... 00 01 .interp 02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame 03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss 04 .dynamic 05 .note.ABI-tag .note.gnu.build-id 06 .eh_frame_hdr 07 08 .ctors .dtors .jcr .dynamic .got 

Qui, il segmento PHDR contiene 0 sezioni, il segmento INTERP contiene la sezione .interp e il primo segmento LOAD contiene un intero gruppo di sezioni.

Ulteriori letture con una bella illustrazione .

La sezione contiene statico per il linker, i dati dinamici del segmento per il sistema operativo

La citazione è corretta, ma per comprenderla effettivamente la differenza, dovresti cercare di capire i campi dell’intestazione della sezione e delle voci dell’intestazione del programma (segmento), e come devono essere usati dal linker (sezioni) e dal sistema operativo (segmento) .

Informazioni particolarmente importanti sono (oltre alle lunghezze):

  • sezione: indica al linker se una sezione è:

    • dati grezzi da caricare in memoria, ad esempio .data , .text , ecc.
    • o metadati formattati su altre sezioni, che saranno utilizzati dal linker, ma scompariranno in fase di esecuzione ad esempio .symtab , .srttab , .rela.text
  • segmento: dice al sistema operativo:

    • dove dovrebbe essere caricato un segmento nella memoria virtuale
    • quali autorizzazioni hanno i segmenti (leggi, scrivi, esegui). Ricorda che questo può essere efficacemente applicato dal processore: come funziona il paging x86?

Ho scritto un tutorial che copre più dettagliatamente su: http://www.cirosantilli.com/elf-hello-world/

Un segmento contiene una o più sezioni?

Sì, ed è il linker che inserisce le sezioni in segmenti.

In Binutils, il modo in cui le sezioni vengono inserite nei segmenti da ld è determinato da un file di testo chiamato script linker . Documenti: https://sourceware.org/binutils/docs/ld/Scripts.html

È ansible ottenere quello predefinito con ld --verbose e impostarne uno personalizzato con -T .

Ad esempio, il mio script linker predefinito di Ubuntu 17.04 contiene:

  .text : { *(.text.unlikely .text.*_unlikely .text.unlikely.*) *(.text.exit .text.exit.*) *(.text.startup .text.startup.*) *(.text.hot .text.hot.*) *(.text .stub .text.* .gnu.linkonce.t.*) } 

che dice al linker di inserire sezioni denominate .text.unlikely , .text.*_unlikely , .text.exit , ecc. nel segmento .text .

Lo sviluppo del sistema operativo è un caso in cui gli script personalizzati sono utili, esempio minimo: https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld

Una volta collegato l’eseguibile, è solo ansible sapere quale sezione è andata a quale segmento se il linker memorizza l’intestazione di sezione facoltativa nell’eseguibile: dove si trova la “Section to segment mapping” memorizzata nei file ELF?