O Tempo Médio entre Falhas (MTBF – Mean Time Between Failures) é uma medida da quantidade média de tempo que ocorre entre as falhas em um sistema, máquina, componente ou equipamento. Para calcular o tempo médio entre falhas, o sistema, ou equipamento, precisa funcionar e depois falhar. O sistema/ equipamento é então reparado e colocado novamente em funcionamento, onde ele acabará por falhar novamente. O tempo entre estas falhas é o primeiro valor no MTBF, e conforme o sistema/ equipamento acumula mais falhas, o tempo médio torna-se mais preciso.

Existem duas condições básicas que compõem este conceito: o tempo médio e o fracasso. O tipo de média referida é uma média aritmética. Tal como acontece com todas as médias, os números mais usados para calcular a média dão o mais preciso o resultado final. Uma vez que os sistemas de computador não falham constantemente, o tempo médio é geralmente uma média de um grande número de diferentes sistemas que são utilizados e construídos de uma maneira semelhante.

A outra condição básica é o fracasso. No caso de máquinas como computadores, por exemplo, existem muitos tipos diferentes de falhas. Neste caso, a falha é um desligamento do sistema total. O sistema está quebrado além de sua capacidade de continuar operando e deve ser reparado antes que ele possa voltar ao serviço. Se uma única peça do computador falhar, como um cartão de memória único, não é considerado um fracasso para o cálculo do tempo médio entre falhas. Além disso, o tempo de inatividade programado como a manutenção não é um fracasso.Tempo Médio entre FalhasEstes valores são muitas vezes utilizados como um sinal de alerta precoce de problemas de hardware não diagnosticados. Se o tempo médio de um sistema entre falhas é muito baixo, então não é, obviamente, um problema no sistema em algum ponto. Designers de computadores também observam o que causou a falha além do período de tempo. Isto dá uma indicação mais clara de onde o problema pode existir e o que precisa acontecer para que possa ser corrigido.

O pessoal de manutenção utiliza o tempo médio entre falhas para projetar a sua programação de manutenção do sistema. Se um sistema tem seu tempo médio entre falhas com meses de distância, torna-se mais fácil determinar qual o sistema deve trabalhar em primeiro lugar. Uma revisão completa e check-up não irão tecnicamente redefinir o tempo médio de um sistema, mas deve criar intervalos mais longos entre falhas, efetivamente deixando o tempo médio mais elevado.

O valor do tempo médio entre falhas é apenas um dos muitos valores utilizados na indústria de transformação e muitas outras indústrias para indicar falhas no sistema. Outros termos comuns incluem tempo médio de falha, quanto tempo leva para catastroficamente falhar na primeira vez, e o tempo médio entre falhas críticas de falhas que são importantes, mas não levam o sistema a ficar offline. Existe também o tempo médio entre substituição da unidade, o qual mede o tempo médio antes um sistema necessitar de ser substituído por outro.