•  

IST Learning

Let's Learn Together

  • Home
  • Courses
    • IST Courses
      • IST 110
      • IST 140
      • IST 210
      • IST 220
      • IST 230
      • IST 234
      • IST 235
      • IST 237
      • IST 240
      • IST 242
      • IST 250
      • IST 256
      • IST 261
      • IST 301
      • IST 302
      • IST 311
      • IST 331
      • IST 337
      • IST 361
      • IST 389
      • IST 402
      • IST 411
      • IST 412
      • IST 413
      • IST 420
      • IST 421
      • IST 423
      • IST 432
      • IST 437
      • IST 440W
      • IST 441
      • IST 446
      • IST 451
      • IST 452
      • IST 454
      • IST 456
      • IST 461
      • IST 489H
    • SRA Courses
      • SRA 111
      • SRA 211
      • SRA 221
      • SRA 231
      • SRA 311
      • SRA 365
      • SRA 421
      • SRA 433
      • SRA 440W
      • SRA 468
      • SRA 471
      • SRA 472
      • SRA 480
    • DS Courses
      • DS 120
      • DS 200
      • DS 220
      • DS 300
      • DS 310
      • DS 320
      • DS 330
      • DS 340W
      • DS 402
      • DS 410
      • DS 440
    • Cyber Courses
      • Cyber 100
      • Cyber 262
      • CYBER 342W
      • Cyber 362
      • CYBER 366
      • CYBER 440
    • HCDD Courses
      • HCDD 113
      • HCDD 264
      • HCDD 340
      • HCDD 364W
      • HCDD 440
    • LionPath Course Catalog
  • Resources
    • Learning Resources
    • IT Certifications
    • IST Advising Center
    • Recommended Academic Plans
    • Office of Career Solutions
    • Diversity at IST
    • Curricular Goals for Undergrads
  • New Students
    • Non-IST Course Support
    • Student Support Services
    • Technology Resources
    • The Study Cycle
    • Library Resources
    • Professional Communication
  • Tutoring
    • University Park Tutoring
    • World Campus Tutoring
    • Peer Tutoring Application
    • Meet Our Tutors
    • Peer Tutor Job Description
    • Programming Resources
  • Workshops
    • Programming Workshops
    • Noon Learning Series Workshops
    • Previous Recorded Workshops
  • LAs
    • LA Job Description
    • LA Application
    • LA Resources & Forms
    • Meet Our LAs
    • Past LAs
  • Contact Us

CORONAVIRUS UPDATES:

Tutoring remains open for students in College of IST courses—see the tutoring tab for details. The College is accepting LA applications for Spring 2021—see the Learning Assistant tab for details. Keep up with Penn State's Keep Learning site for remote instruction along with College resources. Penn State also has a general page on information about the global coronavirus outbreak.

DS 410


Data Analytics at Scale


Sample Syllabi
  • DS 410 SP17 Yen
Course Materials
  • University Bulletin
Course Connections

Prerequisites

  • CMPSC 122
  • DS 220

Follow-Ons

Course Composition and Objectives

  • Broadly explain the challenges of data analytics at scale, cyberinfrastructure (e.g., Hadoop, BDSA) and computational modeling approaches that address these challenges, and their applications to real-world problems
  • Use, adapt, or develop a data analytics cyberinfrastructure to analyze heterogeneous interconnected data for one or more real-world problem domains using a high-level programming language (e.g., R, Java, Pig)
  • Identify, formulate, and solve problems associated with data analytics at scale (e.g., data sparsity, very high dimensionality, causality analysis)
  • Compare the strengths and weakness of alternative cyberinfrastructures and computational modeling approaches so that they can articulate the rationales of their choice, adaptation, and/or innovation in their design and implementation of a solution for data analytics at scale
  • Instructors Choice: Instructors may choose topics and learning objectives that meet the spirit of the course as defined here. Instructors may choose to devote more time to the learning objectives listed above or to add additional, complimentary objectives. Supplementary material and objectives should not overlap with the defined content of other courses in the curriculum.

Course Description

This course introduces principles, models, techniques, and cyberinfrastructures for storing, processing, retrieving, integrating, analyzing, mining, and linking large scale heterogeneous information involving multiple types (including text and images) across multiple scales over temporal, spatial, and human dimensions. The course consists of four major modules. The first module introduces the cyberinfrastructure for data analytics at scale. Leveraging DS 210’s coverage on data models for data sciences, this module introduces the cyberinfrastructures for data-intensive processing at scale and the associated distributed information storage systems. The second module of the course introduces parallel programming and computing platforms supporting computationintensive data analytics at scale. The third module addresses techniques and tools for computation modeling from large-scale heterogeneous data including text and images. Building on DS 310, this module also introduces machine learning methods designed for data mining at scale. The fourth module covers methods for addressing three important challenges and opportunities for data analytics at scale: data sparsity, causality analysis, and discovery informatics. The course will include a laboratory component to provide students with hands-on experience in developing data analytics solutions using an existing cyberinfrastructure. The hands-on laboratory component of the course will also enable

IST Courses

  • IST 110
  • IST 140
  • IST 210
  • IST 220
  • IST 230
  • IST 234
  • IST 235
  • IST 237
  • IST 240
  • IST 242
  • IST 250
  • IST 256
  • IST 261
  • IST 301
  • IST 302
  • IST 311
  • IST 331
  • IST 337
  • IST 361
  • IST 389
  • IST 402
  • IST 411
  • IST 412
  • IST 413
  • IST 420
  • IST 421
  • IST 423
  • IST 432
  • IST 437
  • IST 440W
  • IST 441
  • IST 446
  • IST 451
  • IST 452
  • IST 454
  • IST 456
  • IST 461
  • IST 489H

SRA Courses

  • SRA 111
  • SRA 211
  • SRA 221
  • SRA 231
  • SRA 311
  • SRA 365
  • SRA 421
  • SRA 433
  • SRA 440W
  • SRA 468
  • SRA 471
  • SRA 472
  • SRA 480

DS Courses

  • DS 120
  • DS 200
  • DS 220
  • DS 300
  • DS 310
  • DS 320
  • DS 330
  • DS 340W
  • DS 402
  • DS 410
  • DS 440

HCDD Courses

  • HCDD 113
  • HCDD 264
  • HCDD 340
  • HCDD 364W
  • HCDD 440

CYBER Courses

  • Cyber 100
  • Cyber 262
  • CYBER 342W
  • Cyber 362
  • CYBER 366
  • CYBER 440

Learning in IST


E101 Westgate Building
(814) 865-8947
learning@ist.psu.edu

Student Support Services

  • Learning Resources
  • College of IST Tutoring Sessions for University Park Students
  • IST Advising Center
  • Recommended Academic Plans
  • Office of Career Solutions
  • Diversity at IST
  • Curricular Goals for Undergrads

Learning Assistants

  • LA Introduction
  • LA Job Description
  • LA Application
  • LA Resources & Forms
  • Meet Our LAs
    • Past LAs

Questions?

  • Contact Us

IST Courses

  • IST 110
  • IST 140
  • IST 210
  • IST 220
  • IST 230
  • IST 234
  • IST 235
  • IST 237
  • IST 240
  • IST 242
  • IST 250
  • IST 256
  • IST 261
  • IST 301
  • IST 302
  • IST 311
  • IST 331
  • IST 337
  • IST 361
  • IST 389
  • IST 402
  • IST 411
  • IST 412
  • IST 413
  • IST 420
  • IST 421
  • IST 423
  • IST 432
  • IST 437
  • IST 440W
  • IST 441
  • IST 446
  • IST 451
  • IST 452
  • IST 454
  • IST 456
  • IST 461
  • IST 489H

SRA Courses

  • SRA 111
  • SRA 211
  • SRA 221
  • SRA 231
  • SRA 311
  • SRA 365
  • SRA 421
  • SRA 433
  • SRA 440W
  • SRA 468
  • SRA 471
  • SRA 472
  • SRA 480

DS Courses

  • DS 120
  • DS 200
  • DS 220
  • DS 300
  • DS 310
  • DS 320
  • DS 330
  • DS 340W
  • DS 402
  • DS 410
  • DS 440

CYBER Courses

  • Cyber 100
  • Cyber 262
  • CYBER 342W
  • Cyber 362
  • CYBER 366
  • CYBER 440

HCDD Courses

  • HCDD 113
  • HCDD 264
  • HCDD 340
  • HCDD 364W
  • HCDD 440
  • Privacy
  • Non-Discrimination
  • Equal Opportunity
  • Accessibility
  • Legal

Copyright © 2021 · Education Pro Theme on Genesis Framework · WordPress · Log in