voice.transcription.librispeech-clean-mini

2 entries. Pareto frontier computed on throughput_tok_per_s (higher is better) vs. ttft_p50_ms (lower is better). Rows marked P are on the frontier.

	Model	Engine	Hardware	Quant	TTFT P50 (ms)	TTFT P99 (ms)	Throughput (tok/s)	$/M tokens	J/token	Power avg (W)	Power peak (W)	WER mean	J / audio s	Envelope
	Systran/faster-whisper-large-v3	whisper-http unknown	1x NVIDIA RTX 4000 Ada Generation Laptop GPU	fp16	—	—	—	—	—	11.51	40.50	0.0700	32.33	JSON
	Systran/faster-whisper-large-v3	whisper-http unknown	8x NVIDIA H100 80GB HBM3	fp16	—	—	—	—	—	584	681	0.0700	1,357	JSON