Tendrías que inicializar el sistema de sonido, cargar los sonidos
y luego ir reproduciendo uno a uno.
Para mostrar las imágenes no hay mucho secreto, podrías imprimir
la imagen en pantalla, comenzar a reproducir el sonido y luego
indicarle a pygame que aguarde unos segundos.
Te dejo un programa de ejemplo que hace eso, aunque lo podrías
mejorar mucho:
- Código: Seleccionar todo
- import pygame
 
 # inicializa el sistema de sonido.
 pygame.mixer.init()
 
 # inicializa la ventana.
 screen = pygame.display.set_mode((640, 480))
 
 # carga y comienza a reproducir el sonido de voz.
 pygame.mixer.music.load('hunter.mp3')
 pygame.mixer.music.play()
 
 # imprime el fondo de pantalla.
 fondo = pygame.image.load('fondo.jpg')
 screen.blit(fondo, (0, 0))
 
 # muestra los cambios en pantalla.
 pygame.display.flip()
 
 # espera unos 5 segundos.
 pygame.time.delay(5000)