✨ 채널 추가 기능 고도화 #23

kenu · Jun 4, 2024 · 8e85305 · 8e85305
1 parent 2bcb038
commit 8e85305
Show file tree

Hide file tree

Showing 3 changed files with 39 additions and 19 deletions.
diff --git a/services/channel.js b/services/channel.js
@@ -35,6 +35,7 @@ async function findChannelInfo(forHandle) {
     return data
   } catch (error) {
     console.error('Error:', error)
+    throw error
   }
 }
 

diff --git a/web/routes/admin.js b/web/routes/admin.js
@@ -71,6 +71,7 @@ router.post('/api/channel', async function (req, res, next) {
     ...req.body,
     ...channel,
   }
+
   const result = await dao.create(channel)
   await addVideos(channel.channelId)
   res.json(result.dataValues)
@@ -80,8 +81,8 @@ async function addVideos(channelId) {
   const videos = await vapi.getLatestVideos(channelId)
   await videos
     .map((item) => item.channelId)
-    .forEach(async () => {
-      vapi.addVideos()
+    .forEach(async (channelId) => {
+      vapi.addVideos(channelId)
     })
 }
 

diff --git a/web/utils/transcript.js b/web/utils/transcript.js
@@ -1,33 +1,51 @@
 import { parse } from 'node-html-parser'
 
 async function fetchTranscript(videoId) {
-  const PAGE = await fetch('https://www.youtube.com/watch?v=' + videoId)
-    .then((res) => res.text())
-    .then((html) => parse(html))
+  const videoPageHtml = await fetchHtml(
+    `https://www.youtube.com/watch?v=${videoId}`
+  )
+  const playerScript = findPlayerScript(videoPageHtml)
+  const captionsUrl = extractCaptionsUrl(playerScript)
+  const captionsXml = await fetchXml(
+    captionsUrl.replace('lang=de-DE', 'lang=ko-KR')
+  )
+  const transcript = extractTranscriptFromXml(captionsXml)
+  return transcript
+}
+
+async function fetchHtml(url) {
+  const response = await fetch(url)
+  const html = await response.text()
+  return parse(html)
+}
 
-  const scripts = PAGE.getElementsByTagName('script')
-  const playerScript = scripts.find((script) =>
+function findPlayerScript(html) {
+  const scripts = html.getElementsByTagName('script')
+  return scripts.find((script) =>
     script.textContent.includes('var ytInitialPlayerResponse = {')
   )
+}
 
+function extractCaptionsUrl(playerScript) {
   const dataString = playerScript.textContent
     ?.split('var ytInitialPlayerResponse = ')?.[1]
     ?.slice(0, -1)
   const data = JSON.parse(dataString.trim())
-  const captionsUrl =
-    data.captions.playerCaptionsTracklistRenderer.captionTracks[0].baseUrl
-  const captionsDefault = captionsUrl.replace('lang=de-DE', 'lang=ko-KR')
+  return data.captions.playerCaptionsTracklistRenderer.captionTracks[0].baseUrl
+}
 
-  const resXML = await fetch(captionsDefault)
-    .then((res) => res.text())
-    .then((xml) => parse(xml))
+async function fetchXml(url) {
+  const response = await fetch(url)
+  const xml = await response.text()
+  return parse(xml)
+}
 
-  let transcript = ''
-  const chunks = resXML.getElementsByTagName('text')
-  for (const chunk of chunks) {
-    transcript += chunk.textContent
-  }
-  return transcript
+function extractTranscriptFromXml(xml) {
+  const chunks = xml.getElementsByTagName('text')
+  return Array.from(chunks).reduce(
+    (transcript, chunk) => transcript + chunk.textContent,
+    ''
+  )
 }
 
 export default fetchTranscript