Pretvara audio i govor u tekst — temelj svakog pipeline-a
0
TranskripcijaOsnova?
Pretvara svaki govoreni segment u tekst koristeći OpenAI Whisper Large v3. Output: transkript s vremenskim oznakama po riječima — osnova za sve ostale servise.
Whisper Large v399 jezikaWord timestamps
Govor → tekst s vremenskim oznakama po svakoj riječi · 99 jezika
€0.006
/ min
Speaker Diarization
?
Automatski prepoznaje i razlikuje govornike u snimci. Svaki segment u transkriptu dobiva labelu GOVORNIK_01, GOVORNIK_02... Ključno za intervjue i panele.
pyannote v3.1≤20 govornika
Tko govori kada — automatski labeling govornika po segmentima
€0.004
/ min
PrijevodPopular?
Prevodi transkript na odabrani jezik koristeći DeepL Pro ili GPT-4o. Output: paralelni prijevod s originalnim vremenskim oznakama. Sinkroniziran sa SRT outputom.
DeepL ProGPT-4o fallback30+ jezika
Prevodi transkript na 30+ jezika · DeepL Pro, sinkronizirano s SRT
€0.009
/ min
Subtitles SRT / VTT
?
Iz transkripta generira SRT i VTT datoteke s automatskim prijelomima redaka, max 2 retka po cue-u i čitljivim tempom. Direktan import u Premiere, Resolve, YouTube.
SRT + VTTAuto line-breakMax 42 znaka/red
SRT + VTT titlovi s automatskim prijelomima · import u editor i YouTube
€0.005
/ min
Voice Synthesis
?
Text-to-speech koristeći ElevenLabs naturalnih glasova ili klon tvog glasa. Generira VO naraciju na bazi transkripta ili custom skripte. Output: WAV 44kHz.
ElevenLabsVoice Clone opcijaWAV 44kHz
ElevenLabs VO naracija iz transkripta ili skripte — Voice Clone opcija
€0.14
/ min
💜
Emotions
AI razumijevanje priče, emocija i strukture — radi na transkriptu
0
Sentiment Analysis
Popular?
Analizira emocionalni ton svakoga segmenta: pozitivno, negativno, neutralno, uzbuđenje, tuga, bijeg, humor... Identificira key emotional moments za editing highlights i reels.
Claude 3.5 SonnetSegment-level10 emocija
Emocionalni ton po segmentima — identificira key moments za highlights
€0.012
/ min
Story Summary
?
GPT-4o analizira cijeli transkript i generira sažetak: ključne točke, teme, zaključci, citati. Savršeno za show notes, opise videa, briefinge i email sažetke.
GPT-4o~500 words
GPT-4o sažetak priče — ključne točke, teme, zaključci, citati
€0.016
/ min
Story Outline
New?
Generira strukturirani outline s aktovima i turning pointsima. Koristi narativne obrasce (3-act, Hero's Journey) prilagođene vrsti sadržaja — intervju, reportaža, dokumentarac.
GPT-4o3-act struktura
Narrative struktura s aktovima i turning pointsima — 3-act, Hero's Journey
€0.020
/ min
Key Quotes
?
Izvlači 5–10 najimpaktnijih citata iz snimke s vremenskim oznakama. Idealno za social media clipove, promo reels, pull-quotes u člancima i newsletter snippetove.
Claude 3.5Impact scoring
Najimpaktniiji citati s timecodeovima — za social clipove i pull-quotes
€0.008
/ min
Keywords & Entities
?
Automatski izvlači ključne teme, osobe, mjesta i organizacije (Named Entity Recognition). Generira tagove za pretraživanje arhive i SEO metadata za video platforme.
NERGPT-4o-miniSEO tags
Osobe, mjesta, teme, organizacije — NER tagging i SEO metadata
€0.007
/ min
Auto Chapters
?
Na temelju tematskih promjena generira poglavlja s naslovima i timecodeovima. Direktan YouTube chapters format (00:00 Uvod, 05:23 Tema...) + export za opis videa.
GPT-4oYouTube format
Tematski chapters s naslovima i timecodeovima — YouTube ready format
€0.005
/ min
👁️
Visual
Computer vision — analizira i procesira slike i video okvire
0
Scene Detection
Osnova vizuala?
Detektira shot boundaries i scene cuts u video materijalu analizirajući razliku između uzastopnih kadrova. Output: lista timecodeova + confidence score za svaki cut.
PySceneDetectAdaptive threshold
Shot boundaries i scene cuts s timecodeovima i confidence scoreovima
€0.003
/ min
Key Frame Extraction
?
Iz svake scene automatski izvlači reprezentativni keyframe koristeći SSIM scoring. Koristi se za thumbnail generiranje, pregled materijala i kao input za AI image analizu.
FFmpegSSIM scoringJPEG 1280px
Reprezentativna sličica iz svake scene — osnova za thumbnail i AI analizu
€0.002
/ min
Visual Description
New?
GPT-4o Vision opisuje što se vizualno događa u svakoj sceni: osobe, radnje, okruženje, boje, kompozicija. Kombinira s transkriptom za potpunu kontekstualnu sliku.
GPT-4o VisionScene-level
GPT-4o Vision opisuje svaku scenu — osobe, radnja, okruženje, kompozicija
€0.018
/ min
B-Roll Keywords
Popular?
Kombinira transkript i vizualnu analizu za generiranje konkretnih search querija za B-roll: "aerial city night", "close-up hands typing". Direktna integracija s Storyblocks i Pexels.
GPT-4oStoryblocks APIPexels API
Search queriji za B-roll po segmentu — integracija Storyblocks i Pexels
€0.005
/ min
Thumbnail Generator
?
Na bazi keyframe-ova i story summaryja generira 3 thumbnail prijedloga koristeći DALL·E 3. A/B varijante s različitim naslovima i vizualnim stilovima za CTR testiranje.
DALL·E 33 varijante1280×720
3 AI thumbnail varijante na bazi keyframe-ova — DALL·E 3, 1280×720
€0.012
/ min
AI Music Scoring
New?
Generira pozadinsku glazbu prilagođenu vizualnom ritmu i emocionalnom tonu koristeći Suno AI. Automatski fade na scene prijelazima. Royalty-free za komercijalnu upotrebu.
Suno AIScene-syncedRoyalty-free
Pozadinska glazba sinkronizirana sa scenama — Suno AI, royalty-free