]> git.immae.eu Git - github/Chocobozzz/PeerTube.git/blobdiff - server/tools/peertube-import-videos.ts
Merge branch 'release/4.0.0' into develop
[github/Chocobozzz/PeerTube.git] / server / tools / peertube-import-videos.ts
index 21505b79db972a6d4cc1dcb2698003a67501b402..a758beef9cac3fa0a49099d8058fe1973dd36add 100644 (file)
-// FIXME: https://github.com/nodejs/node/pull/16853
-require('tls').DEFAULT_ECDH_CURVE = 'auto'
+import { registerTSPaths } from '../helpers/register-ts-paths'
+registerTSPaths()
 
-import * as program from 'commander'
-import { join } from 'path'
-import { VideoPrivacy } from '../../shared/models/videos'
-import { doRequestAndSaveToFile } from '../helpers/requests'
-import { CONSTRAINTS_FIELDS } from '../initializers'
-import { getClient, getVideoCategories, login, searchVideoWithSort, uploadVideo } from '../tests/utils'
-import { truncate } from 'lodash'
-import * as prompt from 'prompt'
+import { program } from 'commander'
+import { accessSync, constants } from 'fs'
 import { remove } from 'fs-extra'
+import { join } from 'path'
 import { sha256 } from '../helpers/core-utils'
-import { safeGetYoutubeDL } from '../helpers/youtube-dl'
-import { getSettings, netrc } from './cli'
-
-let accessToken: string
-let client: { id: string, secret: string }
+import { doRequestAndSaveToFile } from '../helpers/requests'
+import {
+  assignToken,
+  buildCommonVideoOptions,
+  buildServer,
+  buildVideoAttributesFromCommander,
+  getLogger,
+  getServerCredentials
+} from './cli'
+import { wait } from '@shared/extra-utils'
+import { YoutubeDLCLI, YoutubeDLInfo, YoutubeDLInfoBuilder } from '@server/helpers/youtube-dl'
+import prompt = require('prompt')
 
 const processOptions = {
-  cwd: __dirname,
   maxBuffer: Infinity
 }
 
-program
+let command = program
   .name('import-videos')
+
+command = buildCommonVideoOptions(command)
+
+command
   .option('-u, --url <url>', 'Server url')
   .option('-U, --username <username>', 'Username')
   .option('-p, --password <token>', 'Password')
-  .option('-t, --target-url <targetUrl>', 'Video target URL')
-  .option('-l, --language <languageCode>', 'Language ISO 639 code (fr or en...)')
-  .option('-v, --verbose', 'Verbose mode')
+  .option('--target-url <targetUrl>', 'Video target URL')
+  .option('--since <since>', 'Publication date (inclusive) since which the videos can be imported (YYYY-MM-DD)', parseDate)
+  .option('--until <until>', 'Publication date (inclusive) until which the videos can be imported (YYYY-MM-DD)', parseDate)
+  .option('--first <first>', 'Process first n elements of returned playlist')
+  .option('--last <last>', 'Process last n elements of returned playlist')
+  .option('--wait-interval <waitInterval>', 'Duration between two video imports (in seconds)', convertIntoMs)
+  .option('-T, --tmpdir <tmpdir>', 'Working directory', __dirname)
+  .usage("[global options] [ -- youtube-dl options]")
   .parse(process.argv)
 
-getSettings()
-.then(settings => {
-  if (
-    (!program['url'] ||
-    !program['username'] ||
-    !program['password']) &&
-    (settings.remotes.length === 0)
-  ) {
-    if (!program['url']) console.error('--url field is required.')
-    if (!program['username']) console.error('--username field is required.')
-    if (!program['password']) console.error('--password field is required.')
-    if (!program['targetUrl']) console.error('--targetUrl field is required.')
-    process.exit(-1)
-  }
+const options = command.opts()
 
-  if (
-    (!program['url'] ||
-    !program['username'] ||
-    !program['password']) &&
-    (settings.remotes.length > 0)
-  ) {
-    if (!program['url']) {
-      program['url'] = (settings.default !== -1) ?
-        settings.remotes[settings.default] :
-        settings.remotes[0]
+const log = getLogger(options.verbose)
+
+getServerCredentials(command)
+  .then(({ url, username, password }) => {
+    if (!options.targetUrl) {
+      exitError('--target-url field is required.')
     }
-    if (!program['username']) program['username'] = netrc.machines[program['url']].login
-    if (!program['password']) program['password'] = netrc.machines[program['url']].password
-  }
 
-  if (
-    !program['targetUrl']
-  ) {
-    if (!program['targetUrl']) console.error('--targetUrl field is required.')
-    process.exit(-1)
+    try {
+      accessSync(options.tmpdir, constants.R_OK | constants.W_OK)
+    } catch (e) {
+      exitError('--tmpdir %s: directory does not exist or is not accessible', options.tmpdir)
+    }
+
+    url = normalizeTargetUrl(url)
+    options.targetUrl = normalizeTargetUrl(options.targetUrl)
+
+    run(url, username, password)
+      .catch(err => exitError(err))
+  })
+  .catch(err => console.error(err))
+
+async function run (url: string, username: string, password: string) {
+  if (!password) password = await promptPassword()
+
+  const youtubeDLBinary = await YoutubeDLCLI.safeGet()
+
+  let info = await getYoutubeDLInfo(youtubeDLBinary, options.targetUrl, command.args)
+
+  if (!Array.isArray(info)) info = [ info ]
+
+  // Try to fix youtube channels upload
+  const uploadsObject = info.find(i => !i.ie_key && !i.duration && i.title === 'Uploads')
+
+  if (uploadsObject) {
+    console.log('Fixing URL to %s.', uploadsObject.url)
+
+    info = await getYoutubeDLInfo(youtubeDLBinary, uploadsObject.url, command.args)
   }
 
-  const user = {
-    username: program['username'],
-    password: program['password']
+  let infoArray: any[]
+
+  infoArray = [].concat(info)
+  if (options.first) {
+    infoArray = infoArray.slice(0, options.first)
+  } else if (options.last) {
+    infoArray = infoArray.slice(-options.last)
   }
 
-  run(user, program['url']).catch(err => console.error(err))
-})
+  log.info('Will download and upload %d videos.\n', infoArray.length)
 
-async function promptPassword () {
-  return new Promise((res, rej) => {
-    prompt.start()
-    const schema = {
-      properties: {
-        password: {
-          hidden: true,
-          required: true
-        }
-      }
-    }
-    prompt.get(schema, function (err, result) {
-      if (err) {
-        return rej(err)
+  let skipInterval = true
+  for (const [ index, info ] of infoArray.entries()) {
+    try {
+      if (index > 0 && options.waitInterval && !skipInterval) {
+        log.info("Wait for %d seconds before continuing.", options.waitInterval / 1000)
+        await wait(options.waitInterval)
       }
-      return res(result.password)
-    })
-  })
-}
 
-async function run (user, url: string) {
-  if (!user.password) {
-    user.password = await promptPassword()
+      skipInterval = await processVideo({
+        cwd: options.tmpdir,
+        url,
+        username,
+        password,
+        youtubeInfo: info
+      })
+    } catch (err) {
+      console.error('Cannot process video.', { info, url, err })
+    }
   }
 
-  const res = await getClient(url)
-  client = {
-    id: res.body.client_id,
-    secret: res.body.client_secret
-  }
+  log.info('Video/s for user %s imported: %s', username, options.targetUrl)
+  process.exit(0)
+}
 
-  const res2 = await login(url, client, user)
-  accessToken = res2.body.access_token
+async function processVideo (parameters: {
+  cwd: string
+  url: string
+  username: string
+  password: string
+  youtubeInfo: any
+}) {
+  const { youtubeInfo, cwd, url, username, password } = parameters
 
-  const youtubeDL = await safeGetYoutubeDL()
+  log.debug('Fetching object.', youtubeInfo)
 
-  const options = [ '-j', '--flat-playlist', '--playlist-reverse' ]
-  youtubeDL.getInfo(program['targetUrl'], options, processOptions, async (err, info) => {
-    if (err) {
-      console.log(err.message)
-      process.exit(1)
-    }
+  const videoInfo = await fetchObject(youtubeInfo)
+  log.debug('Fetched object.', videoInfo)
 
-    let infoArray: any[]
+  if (options.since && videoInfo.originallyPublishedAt && videoInfo.originallyPublishedAt.getTime() < options.since.getTime()) {
+    log.info('Video "%s" has been published before "%s", don\'t upload it.\n', videoInfo.name, formatDate(options.since))
+    return true
+  }
 
-    // Normalize utf8 fields
-    if (Array.isArray(info) === true) {
-      infoArray = info.map(i => normalizeObject(i))
-    } else {
-      infoArray = [ normalizeObject(info) ]
-    }
-    console.log('Will download and upload %d videos.\n', infoArray.length)
+  if (options.until && videoInfo.originallyPublishedAt && videoInfo.originallyPublishedAt.getTime() > options.until.getTime()) {
+    log.info('Video "%s" has been published after "%s", don\'t upload it.\n', videoInfo.name, formatDate(options.until))
+    return true
+  }
 
-    for (const info of infoArray) {
-      await processVideo(info, program['language'], processOptions.cwd, url, user)
+  const server = buildServer(url)
+  const { data } = await server.search.advancedVideoSearch({
+    search: {
+      search: videoInfo.name,
+      sort: '-match',
+      searchTarget: 'local'
     }
-
-    console.log('Video/s for user %s imported: %s', program['username'], program['targetUrl'])
-    process.exit(0)
   })
-}
 
-function processVideo (info: any, languageCode: string, cwd: string, url: string, user) {
-  return new Promise(async res => {
-    if (program['verbose']) console.log('Fetching object.', info)
+  log.info('############################################################\n')
 
-    const videoInfo = await fetchObject(info)
-    if (program['verbose']) console.log('Fetched object.', videoInfo)
+  if (data.find(v => v.name === videoInfo.name)) {
+    log.info('Video "%s" already exists, don\'t reupload it.\n', videoInfo.name)
+    return true
+  }
 
-    const result = await searchVideoWithSort(url, videoInfo.title, '-match')
+  const path = join(cwd, sha256(videoInfo.url) + '.mp4')
 
-    console.log('############################################################\n')
+  log.info('Downloading video "%s"...', videoInfo.name)
 
-    if (result.body.data.find(v => v.name === videoInfo.title)) {
-      console.log('Video "%s" already exists, don\'t reupload it.\n', videoInfo.title)
-      return res()
-    }
+  try {
+    const youtubeDLBinary = await YoutubeDLCLI.safeGet()
+    const output = await youtubeDLBinary.download({
+      url: videoInfo.url,
+      format: YoutubeDLCLI.getYoutubeDLVideoFormat([]),
+      output: path,
+      additionalYoutubeDLArgs: command.args,
+      processOptions
+    })
 
-    const path = join(cwd, sha256(videoInfo.url) + '.mp4')
+    log.info(output.join('\n'))
+    await uploadVideoOnPeerTube({
+      cwd,
+      url,
+      username,
+      password,
+      videoInfo,
+      videoPath: path
+    })
+  } catch (err) {
+    log.error(err.message)
+  }
 
-    console.log('Downloading video "%s"...', videoInfo.title)
+  return false
+}
 
-    const options = [ '-f', 'bestvideo[ext=mp4]+bestaudio[ext=m4a]/best', '-o', path ]
-    try {
-      const youtubeDL = await safeGetYoutubeDL()
-      youtubeDL.exec(videoInfo.url, options, processOptions, async (err, output) => {
-        if (err) {
-          console.error(err)
-          return res()
-        }
+async function uploadVideoOnPeerTube (parameters: {
+  videoInfo: YoutubeDLInfo
+  videoPath: string
+  cwd: string
+  url: string
+  username: string
+  password: string
+}) {
+  const { videoInfo, videoPath, cwd, url, username, password } = parameters
 
-        console.log(output.join('\n'))
-        await uploadVideoOnPeerTube(normalizeObject(videoInfo), path, cwd, url, user, languageCode)
-        return res()
-      })
-    } catch (err) {
-      console.log(err.message)
-      return res()
-    }
-  })
-}
+  const server = buildServer(url)
+  await assignToken(server, username, password)
+
+  let thumbnailfile: string
+  if (videoInfo.thumbnailUrl) {
+    thumbnailfile = join(cwd, sha256(videoInfo.thumbnailUrl) + '.jpg')
 
-async function uploadVideoOnPeerTube (videoInfo: any, videoPath: string, cwd: string, url: string, user, language?: string) {
-  const category = await getCategory(videoInfo.categories, url)
-  const licence = getLicence(videoInfo.license)
-  let tags = []
-  if (Array.isArray(videoInfo.tags)) {
-    tags = videoInfo.tags
-      .filter(t => t.length < CONSTRAINTS_FIELDS.VIDEOS.TAG.max && t.length > CONSTRAINTS_FIELDS.VIDEOS.TAG.min)
-      .map(t => t.normalize())
-      .slice(0, 5)
+    await doRequestAndSaveToFile(videoInfo.thumbnailUrl, thumbnailfile)
   }
 
-  let thumbnailfile
-  if (videoInfo.thumbnail) {
-    thumbnailfile = join(cwd, sha256(videoInfo.thumbnail) + '.jpg')
+  const baseAttributes = await buildVideoAttributesFromCommander(server, program, videoInfo)
 
-    await doRequestAndSaveToFile({
-      method: 'GET',
-      uri: videoInfo.thumbnail
-    }, thumbnailfile)
-  }
+  const attributes = {
+    ...baseAttributes,
+
+    originallyPublishedAt: videoInfo.originallyPublishedAt
+      ? videoInfo.originallyPublishedAt.toISOString()
+      : null,
 
-  const videoAttributes = {
-    name: truncate(videoInfo.title, {
-      'length': CONSTRAINTS_FIELDS.VIDEOS.NAME.max,
-      'separator': /,? +/,
-      'omission': ' […]'
-    }),
-    category,
-    licence,
-    language,
-    nsfw: isNSFW(videoInfo),
-    waitTranscoding: true,
-    commentsEnabled: true,
-    description: videoInfo.description || undefined,
-    support: undefined,
-    tags,
-    privacy: VideoPrivacy.PUBLIC,
-    fixture: videoPath,
     thumbnailfile,
-    previewfile: thumbnailfile
+    previewfile: thumbnailfile,
+    fixture: videoPath
   }
 
-  console.log('\nUploading on PeerTube video "%s".', videoAttributes.name)
+  log.info('\nUploading on PeerTube video "%s".', attributes.name)
+
   try {
-    await uploadVideo(url, accessToken, videoAttributes)
+    await server.videos.upload({ attributes })
   } catch (err) {
     if (err.message.indexOf('401') !== -1) {
-      console.log('Got 401 Unauthorized, token may have expired, renewing token and retry.')
+      log.info('Got 401 Unauthorized, token may have expired, renewing token and retry.')
 
-      const res = await login(url, client, user)
-      accessToken = res.body.access_token
+      server.accessToken = await server.login.getAccessToken(username, password)
 
-      await uploadVideo(url, accessToken, videoAttributes)
+      await server.videos.upload({ attributes })
     } else {
-      console.log(err.message)
-      process.exit(1)
+      exitError(err.message)
     }
   }
 
   await remove(videoPath)
   if (thumbnailfile) await remove(thumbnailfile)
 
-  console.log('Uploaded video "%s"!\n', videoAttributes.name)
+  log.info('Uploaded video "%s"!\n', attributes.name)
 }
 
-async function getCategory (categories: string[], url: string) {
-  if (!categories) return undefined
+/* ---------------------------------------------------------- */
 
-  const categoryString = categories[0]
+async function fetchObject (info: any) {
+  const url = buildUrl(info)
 
-  if (categoryString === 'News & Politics') return 11
+  const youtubeDLCLI = await YoutubeDLCLI.safeGet()
+  const result = await youtubeDLCLI.getInfo({
+    url,
+    format: YoutubeDLCLI.getYoutubeDLVideoFormat([]),
+    processOptions
+  })
 
-  const res = await getVideoCategories(url)
-  const categoriesServer = res.body
+  const builder = new YoutubeDLInfoBuilder(result)
 
-  for (const key of Object.keys(categoriesServer)) {
-    const categoryServer = categoriesServer[key]
-    if (categoryString.toLowerCase() === categoryServer.toLowerCase()) return parseInt(key, 10)
-  }
+  const videoInfo = builder.getInfo()
 
-  return undefined
+  return { ...videoInfo, url }
 }
 
-/* ---------------------------------------------------------- */
-
-function getLicence (licence: string) {
-  if (!licence) return undefined
+function buildUrl (info: any) {
+  const webpageUrl = info.webpage_url as string
+  if (webpageUrl?.match(/^https?:\/\//)) return webpageUrl
 
-  if (licence.indexOf('Creative Commons Attribution licence') !== -1) return 1
+  const url = info.url as string
+  if (url?.match(/^https?:\/\//)) return url
 
-  return undefined
+  // It seems youtube-dl does not return the video url
+  return 'https://www.youtube.com/watch?v=' + info.id
 }
 
-function normalizeObject (obj: any) {
-  const newObj: any = {}
-
-  for (const key of Object.keys(obj)) {
-    // Deprecated key
-    if (key === 'resolution') continue
+function normalizeTargetUrl (url: string) {
+  let normalizedUrl = url.replace(/\/+$/, '')
 
-    const value = obj[key]
-
-    if (typeof value === 'string') {
-      newObj[key] = value.normalize()
-    } else {
-      newObj[key] = value
-    }
+  if (!normalizedUrl.startsWith('http://') && !normalizedUrl.startsWith('https://')) {
+    normalizedUrl = 'https://' + normalizedUrl
   }
 
-  return newObj
+  return normalizedUrl
 }
 
-function fetchObject (info: any) {
-  const url = buildUrl(info)
-
-  return new Promise<any>(async (res, rej) => {
-    const youtubeDL = await safeGetYoutubeDL()
-    youtubeDL.getInfo(url, undefined, processOptions, async (err, videoInfo) => {
-      if (err) return rej(err)
-
-      const videoInfoWithUrl = Object.assign(videoInfo, { url })
-      return res(normalizeObject(videoInfoWithUrl))
+async function promptPassword () {
+  return new Promise<string>((res, rej) => {
+    prompt.start()
+    const schema = {
+      properties: {
+        password: {
+          hidden: true,
+          required: true
+        }
+      }
+    }
+    prompt.get(schema, function (err, result) {
+      if (err) {
+        return rej(err)
+      }
+      return res(result.password)
     })
   })
 }
 
-function buildUrl (info: any) {
-  const webpageUrl = info.webpage_url as string
-  if (webpageUrl && webpageUrl.match(/^https?:\/\//)) return webpageUrl
+function parseDate (dateAsStr: string): Date {
+  if (!/\d{4}-\d{2}-\d{2}/.test(dateAsStr)) {
+    exitError(`Invalid date passed: ${dateAsStr}. Expected format: YYYY-MM-DD. See help for usage.`)
+  }
+  const date = new Date(dateAsStr)
+  date.setHours(0, 0, 0)
+  if (isNaN(date.getTime())) {
+    exitError(`Invalid date passed: ${dateAsStr}. See help for usage.`)
+  }
+  return date
+}
 
-  const url = info.url as string
-  if (url && url.match(/^https?:\/\//)) return url
+function formatDate (date: Date): string {
+  return date.toISOString().split('T')[0]
+}
 
-  // It seems youtube-dl does not return the video url
-  return 'https://www.youtube.com/watch?v=' + info.id
+function convertIntoMs (secondsAsStr: string): number {
+  const seconds = parseInt(secondsAsStr, 10)
+  if (seconds <= 0) {
+    exitError(`Invalid duration passed: ${seconds}. Expected duration to be strictly positive and in seconds`)
+  }
+  return Math.round(seconds * 1000)
 }
 
-function isNSFW (info: any) {
-  if (info.age_limit && info.age_limit >= 16) return true
+function exitError (message: string, ...meta: any[]) {
+  // use console.error instead of log.error here
+  console.error(message, ...meta)
+  process.exit(-1)
+}
 
-  return false
+function getYoutubeDLInfo (youtubeDLCLI: YoutubeDLCLI, url: string, args: string[]) {
+  return youtubeDLCLI.getInfo({
+    url,
+    format: YoutubeDLCLI.getYoutubeDLVideoFormat([]),
+    additionalYoutubeDLArgs: [ '-j', '--flat-playlist', '--playlist-reverse', ...args ],
+    processOptions
+  })
 }